Amazon Web Services anuncia disponibilidade do Redshift para região de São Paulo

Serviço rápido e avançado de data warehouse facilita a análise de petabytes de dados por um décimo do valor dos data warehouses tradicionais.

São Paulo — 10 de novembro de 2016 – A Amazon Web Services Inc., uma empresa Amazon.com (NASDAQ:AMZN), anunciou a disponibilidade do Amazon Redshift para a região de São Paulo. O Amazon Redshift é uma solução avançada de data warehouse na nuvem, totalmente gerenciada e em escala de petabytes, que capacita os clientes a aumentar significativamente a velocidade do desempenho de consultas durante a análise de conjuntos de dados de todos os tamanhos. Para tanto, eles podem continuar a usar as mesmas ferramentas de Business Intelligence em SQL que já conhecem. Com alguns cliques no AWS Management Console, eles podem iniciar um cluster do Redshift de poucas centenas de gigabytes e escalá-lo até um petabyte ou mais, a um décimo do valor das soluções tradicionais de data warehouse presentes no mercado atual.

Data warehouses autogerenciáveis e locais exigem tempo e recursos significativos para serem administrados, especialmente para grandes conjuntos de dados. Tarefas como carregamento, monitoramento, tuning e recuperação de backups e de erros são complexas e demoradas. Além disso, os custos associados à construção, manutenção e crescimento das estruturas tradicionais é muito alto. Empresas de maior porte se conformaram em arcar com esses custos. Já grande parte das empresas de menor porte acabam não podendo contar com os recursos de data warehouse, visto que os custos de hardware e software relacionados são altos demais e proibitivos para seus orçamentos. O objetivo do Amazon Redshift é mudar esse cenário e gerenciar todo o trabalho necessário para configurar, operar e escalar data warehouses, desde o provisionamento de capacidade até o monitoramento e backup do cluster e a aplicação de patches e atualizações. Com o Amazon Redshift, é simples e fácil escalar um cluster para garantir melhor desempenho ou maior capacidade. Isso é feito sem tempo de inatividade e o serviço monitora continuamente a integridade do cluster, além de substituir automaticamente qualquer componente necessário. O Amazon Redshift apresenta excelente custo-benefício (comercializado a uma fração do valor de data warehouses tradicionais), permitindo que empresas de grande porte reduzam substancialmente seus custos e que as de pequeno porte se beneficiem dos insights analíticos resultantes do uso de um data warehouse avançado.

“Ao longo dos últimos anos, foram muitos os pedidos de clientes para que a AWS desenvolvesse um serviço de data warehouse”, afirmou Raju Gulabani, vice-presidente de Database Services da AWS. “As corporações estão cansadas de pagar altos preços por seus data warehouses, enquanto as pequenas empresas não podem arcar com os custos para analisar a grande quantidade de dados coletada (o que os leva a desperdiçar 95% deles). Os clientes ficavam frustrados com essa realidade, principalmente por saberem que a nuvem facilitou e reduziu os gastos associados à coleta, análise e ao armazenamento de dados. O Amazon Redshift reduz substancialmente o custo do data warehouse e facilita a análise rápida de grandes quantidades de dados. Embora o desempenho varie conforme os requisitos específicos de consulta de cada cliente, nossos testes internos demonstraram um desempenho 10 vezes melhor em comparação aos data warehouses relacionais padrão. Para nossos clientes, a capacidade de analisar petabytes de dados rapidamente e a um custo reduzido é transformador.”

O Amazon Redshift usa várias técnicas, inclusive armazenamento de dados colunar, compactação avançada, rede e I/O de alto desempenho, a fim de atingir um desempenho significativamente melhor do que bancos de dados tradicionais para cargas de trabalho de data warehouses e de lógica analítica. Ao distribuir e paralelizar as consultas em clusters de nós de baixo custo, ele ajuda a alcançar alto desempenho sem a necessidade de tuning manual de consultas, manutenção de índices ou pré-cálculo de resultados. O Amazon Redshift ainda é certificado por ferramentas populares de Business Intelligence, como Jaspersoft e MicroStrategy.

Desde seu lançamento global em 2013, os clientes do Amazon Redshift criaram dezenas de milhares de data warehouses de desenvolvimento, teste e produção. O serviço foi adotado por corporações de vários setores, como os de publicidade, serviços financeiros, manufatura, mídia, saúde, mídias sociais, aplicativos móveis e jogos. Hoje, clientes como Financial Times, Nasdaq OMX, Nokia e Pinterest usam o Amazon Redshift para uma variedade de casos de uso analíticos, inclusive data warehouses corporativos, valor do tempo de vida do cliente, clickstream, tráfego, interação com usuários e publicidade on-line.

Os clientes do Amazon Redshift podem escolher entre dois nós: computacionais densos e de armazenamento densos. Os nós computacionais densos para Amazon Redshift são ideais para clientes com volume menor que 500 GB em seu data warehouse e para aqueles com volume maior que 500 GB, mas cujo foco principal seja desempenho. Com nós computacionais densos, os clientes podem escalar até centenas de terabytes, o que garante uma maior taxa do CPU, memória e I/O disponibilizada para armazenamento. Se o desempenho não for essencial para o caso de uso do cliente, ou se ele desejar priorizar a redução de custos, ele pode usar os nós de armazenamento densos, maiores, e escalar até 1 petabyte ou mais para dados de usuário compactados. O scale-up e scale-down de um cluster, assim como a alternância entre tipos de nós, são realizados com apenas uma chamada de API ou alguns cliques no AWS Management Console.

“O Amazon Enterprise Data Warehouse gerencia petabytes de dados para todos os grupos da Amazon. Estamos observando um aumento significativo de desempenho ao comparar a utilização do Amazon Redshift com nosso data warehouse atual, cujo valor ultrapassa os milhões de dólares”, afirmou Erik Seberg, gerente da equipe do Amazon.com Data Warehouse. “Algumas consultas, que costumavam demorar muitas horas, estão sendo concluídas em menos de uma hora. Outras, que demoravam entre 5 e 10 minutos em nosso data warehouse atual, estão sendo concluídas em segundos com o Amazon Redshift. As estimativas iniciais indicam que o custo do Amazon Redshift representará menos de um décimo do custo da solução atual. Ele nos oferece uma maneira eficiente e econômica de escalar de acordo com nossas necessidades crescentes de análise de dados.”

O Amazon Redshift conta com componentes tecnológicos licenciados da ParAccel e está disponível em dois tipos de nós subjacentes, com 2 ou 16 terabytes de dados de clientes compactados por nó. Um cluster pode ser dimensionado até 100 nós e os preço inicial sob demanda é de apenas US$ 1,36 (aproximadamente R$ 4,40) por hora para um data warehouse de 2 terabytes, a ser escalado linearmente até 1 petabyte ou mais. As instâncias reservadas reduzem o preço efetivo para US$ 0,509 (aproximadamente R$ 1,65) por hora — menos de um décimo do preço de tecnologias similares disponíveis atualmente.

Em 2015, o GFG (Global Fashion Group), grupo on-line que controla a Dafiti, a Kanui e a Tricae, consolidaram seus serviços de TI. A empresa buscava por ferramentas mais ágeis de Business Intelligence e uma solução capaz de processar um grande volume de informações em tempo real. “Com o Redshift, agora analisamos centenas de bilhões de dados. Assim, podemos compreender melhor e mais rapidamente o comportamento dos consumidores, possibilitando a melhoria constante da experiência do usuário. Somos mais resilientes, rápidos, criativos e focados em nossos negócios”, disse o diretor de TI do grupo, Caio Motta.

Os clientes podem iniciar os cluster do Amazon Redshift pelo AWS Management Console ou pela AQS Command Line Interface (CLI). Os usuários que nunca utilizaram a solução podem testá-la gratuitamente por um período de dois meses.

Para saber mais, acesse http://aws.amazon.com/redshift.