No AWS re:Invent, a Amazon Web Services, Inc. (AWS), uma empresa da Amazon.com, Inc. (NASDAQ: AMZN), anunciou a próxima geração do Amazon SageMaker, unificando os recursos que os clientes precisam para análises SQL rápidas, processamento de big data em escala de petabytes, exploração e integração de dados, desenvolvimento e treinamento de modelos e inteligência artificial generativa (IA) em uma plataforma integrada.
O novo SageMaker Unified Studi ajuda os clientes a encontrarem e acessarem dados de toda a organização e reúne recursos de análise, machine learning (ML) e IA da AWS desenvolvidos para esse fim, para que os clientes possam agir em seus dados usando a melhor ferramenta para o trabalho em todos os tipos de casos de uso de dados comuns, auxiliados pelo Amazon Q Developer ao longo do caminho.
O SageMaker Catalog e os recursos de governança integrados permitem que os usuários certos acessem os dados, modelos e artefatos de desenvolvimento corretos para o devido propósito.
O novo SageMaker Lakehouse unifica dados em data lakes, data warehouses, bancos de dados operacionais e aplicativos corporativos, facilitando o acesso e o trabalho com dados de dentro do SageMaker Unified Studio e usando ferramentas familiares de IA e ML ou mecanismos de consulta compatíveis com o Apache Iceberg.
Novas integrações zero-ETL com aplicativos líderes de Software-as-a-Service (SaaS) facilitam o acesso a dados de aplicativos SaaS de terceiros no SageMaker Lakehouse e Amazon Redshift para análises ou ML sem pipelines de dados complexos.
Clientes e parceiros, incluindo Adastra, Confluent, Etleap, idealista, Informatica, Lennar, Natera, NatWest Group, NTT Data, Roche, Tableau e outros, já estão explorando a próxima geração do SageMaker para reunir suas iniciativas de dados, análises e IA.
“Estamos vendo uma convergência de análise e IA, com clientes usando dados de maneiras cada vez mais interconectadas — de análise histórica a treinamento de modelo de ML e aplicativos de IA generativa”, disse Swami Sivasubramanian, vice-presidente de Dados e IA da AWS. “Para dar assistência a essas cargas de trabalho, muitos clientes já usam combinações de nossas ferramentas de análise e ML desenvolvidas para esse propósito, como o Amazon SageMaker — o padrão real para trabalhar com dados e construir modelos de ML — Amazon EMR, Amazon Redshift, data lakes do Amazon S3 e AWS Glue. A próxima geração do SageMaker reúne esses recursos — junto com alguns novos recursos interessantes — para dar aos clientes todas as ferramentas de que precisam para processamento de dados, análise de SQL, desenvolvimento e treinamento de modelo de ML e IA generativa, diretamente no SageMaker.”
Crie mais rápido
Hoje, centenas de milhares de clientes usam o SageMaker para criar, treinar e implantar modelos de ML. Muitos clientes também contam com o conjunto abrangente de serviços de análise desenvolvidos especificamente pela AWS para dar assistência a uma ampla variedade de cargas de trabalho, incluindo análise de SQL e de pesquisa, processamento de big data e análise de streaming. Cada vez mais, os clientes não estão usando essas ferramentas isoladamente; em vez disso, usam uma combinação de análise, ML e IA generativa para obter insights e potencializar novas experiências para seus usuários. Esses clientes se beneficiariam de um ambiente unificado que reúne ferramentas familiares da AWS para análise, ML e IA generativa, juntamente com fácil acesso a todos os seus dados e a capacidade de participar em projetos de dados com outros membros de sua equipe ou organização.
A próxima geração do SageMaker inclui um novo estúdio unificado que oferece aos clientes um único ambiente de desenvolvimento de dados e IA, no qual os usuários podem encontrar e acessar todos os dados em sua organização, agir sobre eles usando a melhor ferramenta para o trabalho em todos os tipos de casos comuns e participar dentro de equipes e entre funções para dimensionar seus dados e iniciativas de IA. O SageMaker Unified Studio reúne funcionalidades e ferramentas da gama de “estúdios” autônomos, editores de consultas e ferramentas visuais que os clientes desfrutam hoje no Amazon Bedrock, Amazon EMR, Amazon Redshift, AWS Glue e no SageMaker Studio existente. Isso torna mais fácil para os clientes acessarem e usarem esses recursos para descobrir e preparar dados, criar consultas ou códigos, processar dados e construir modelos de ML. O Amazon Q Developer auxilia ao longo do caminho para dar assistência para tarefas de desenvolvimento, como descoberta de dados, codificação, geração de SQL e integração de dados.
Desta forma, um usuário pode perguntar ao Amazon Q, por exemplo: “Quais dados devo usar para ter uma ideia melhor das vendas de produtos?” ou “Gerar um SQL para calcular a receita total por categoria de produto”. Os usuários podem publicar e compartilhar com segurança dados, modelos, aplicativos e outros artefatos com membros de sua equipe ou organização, acelerando assim a descoberta e o uso dos ativos de dados. Com o ambiente de desenvolvimento integrado (IDE) do Amazon Bedrock no SageMaker Unified Studio, os usuários podem criar e implantar aplicativos de IA generativos de forma rápida e fácil usando a seleção de modelos e ferramentas de base de alto desempenho do Amazon Bedrock, como Agentes, Guardrails, Bases de Conhecimento e Fluxos. O SageMaker Unified Studio vem com recursos de descoberta, compartilhamento e governança de dados integrados, para que analistas, cientistas de dados e engenheiros possam pesquisar e encontrar facilmente os dados certos de que precisam para seu caso de uso, ao mesmo tempo em que aplicam os controles e permissões de segurança desejados, mantendo o controle de acesso e protegendo seus dados.
O NatWest Group, um banco líder no Reino Unido que atende a mais de 19 milhões de clientes, usa várias ferramentas para engenharia de dados, análise de SQL, ML e cargas de trabalho de IA generativa. Com o SageMaker Unified Studio, o NatWest Group terá um único ambiente unificado em toda a organização para dar assistência a essas cargas de trabalho e prevê uma redução de 50% no tempo necessário para que seus usuários de dados acessem recursos de análise e IA permitindo que gastem menos tempo gerenciando vários serviços e mais tempo inovando para seus clientes.
Governança de dados e IA
A próxima geração do SageMaker simplifica a descoberta, a governança e a participação dos dados e IA em uma organização. Com o SageMaker Catalog, criado no Amazon DataZone, os administradores podem definir e implementar políticas de acesso consistentes usando um único modelo de permissão com controles granulares, enquanto os trabalhadores de dados de todas as equipes podem descobrir e acessar com segurança dados e modelos aprovados enriquecidos com metadados de contexto de negócios criados por IA generativa. Os administradores podem definir e aplicar permissões facilmente em modelos, ferramentas e fontes de dados, enquanto proteções personalizadas ajudam a tornar os aplicativos de IA seguros e compatíveis. Os clientes também podem proteger seus modelos de IA com classificação de dados, detecção de toxicidade, guardrails e políticas de IA responsáveis no SageMaker.
Reduza os silos de dados
Mais de um milhão de data lakes são criados no Amazon Simple Storage Service (Amazon S3), permitindo que os clientes centralizem seus ativos de dados e obtenham valor com ferramentas de análise, IA e ML da AWS. Os data lakes possibilitam que os clientes armazenem seus dados como estão, facilitando a sua combinação por várias fontes. Os clientes podem ter dados espalhados em vários data lakes, bem como em um data warehouse, e se beneficiariam de uma maneira simples de unifica-los.
O SageMaker Lakehouse fornece acesso unificado aos dados armazenados em data lakes do Amazon S3, data warehouses do Redshift e fontes de dados federadas, reduzindo silos de dados e facilitando a consulta, não importa como e onde eles estejam fisicamente armazenados. Com esse novo recurso de lakehouse compatível com Apache Iceberg no SageMaker, os clientes podem acessar e trabalhar com todos os seus dados de dentro do SageMaker Unified Studio, bem como com ferramentas familiares de IA e ML e mecanismos de consulta compatíveis com os padrões abertos do Apache Iceberg. Agora, os clientes podem usar suas ferramentas preferidas de análise e ML em seus dados, não importa como e onde eles estejam fisicamente armazenados, para dar assistência em casos de uso, incluindo análise de SQL, consulta ad-hoc, ciência de dados, ML e IA generativa. O SageMaker Lakehouse fornece controles de acesso integrados e detalhados que são aplicados consistentemente em todos os dados em todas as ferramentas de análise e IA no lakehouse, permitindo que os clientes definam permissões uma vez e compartilhem informações com segurança em sua organização.
Roche, pioneira global em produtos farmacêuticos e diagnósticos focada no avanço da ciência para melhorar a vida das pessoas, usará o SageMaker Lakehouse para unificar dados dos data lakes Redshift e Amazon S3, eliminando silos de dados, aprimorando a interoperabilidade entre equipes e permitindo que os usuários aproveitem sem interrupção, sem a necessidade de sua movimentação dispendiosa ou controles de acesso de segurança duplicados. Com o SageMaker Lakehouse, a Roche prevê uma redução de 40% no tempo de processamento de dados, permitindo que eles se concentrem mais em impulsionar seus negócios e menos no gerenciamento de dados.
Acesse dados SaaS de forma rápida e fácil
Para realmente aproveitar os dados em suas operações, as empresas precisam de acesso contínuo a todos, independentemente de sua localização. É por isso que a AWS investiu em um futuro zero-ETL, no qual a integração de dados não é mais um esforço manual e tedioso, e os clientes podem facilmente obter seus dados onde precisam. Isso inclui integrações zero-ETL para Amazon Aurora MySQL e PostgreSQL, Amazon RDS para MySQL e Amazon DynamoDB com Amazon Redshift, que ajudam os clientes a acessarem dados de forma rápida e fácil de bancos de dados relacionais e não relacionais populares no Redshift e SageMaker Lakehouse para análise e ML. Além de bancos de dados operacionais e data lakes, muitos clientes também têm dados empresariais críticos armazenados em aplicativos SaaS e se beneficiariam do fácil acesso a esses dados para análise e ML.
As novas integrações zero-ETL com aplicativos SaaS facilitam o acesso dos clientes aos seus dados de aplicativos como Zendesk e SAP no SageMaker Lakehouse e Redshift para análise e IA. Isso elimina a necessidade de pipelines de dados, que podem ser desafiadores e caros para construir, complexos para gerenciar e propensos a erros que podem atrasar o acesso a insights sensíveis ao tempo. As integrações zero-ETL para aplicativos SaaS incorporam as melhores práticas para sincronização completa de dados, detecção de atualizações e exclusões incrementais e operações de mesclagem de destino.
Organizações de todos os tamanhos e setores, incluindo Infosys, Intuit e Woolworths, já estão se beneficiando das integrações zero-ETL da AWS para conectar e analisar dados de forma rápida e fácil sem construir e gerenciar pipelines. Com as integrações zero-ETL para aplicativos SaaS, por exemplo, a plataforma imobiliária online idealista poderá simplificar seus processos de extração e ingestão de dados, eliminando a necessidade de vários pipelines para acessar dados armazenados em aplicativos SaaS de terceiros e liberando sua equipe de engenharia de dados para se concentrar em derivar insights acionáveis de dados em vez de construir e gerenciar infraestrutura.
A próxima geração do SageMaker está disponível hoje. O SageMaker Unified Studio está atualmente em visualização e será disponibilizado em breve.
Sobre a Amazon Web Services
Desde 2006, a Amazon Web Services tem sido a nuvem mais abrangente e amplamente adotada do mundo. A AWS vem expandindo continuamente seus serviços para suportar praticamente qualquer carga de trabalho, e agora possui mais de 240 serviços completos para computação, armazenamento, bancos de dados, redes, análises, aprendizado de máquina e inteligência artificial (IA), Internet das Coisas (IoT), dispositivos móveis, segurança, híbrido, mídia e desenvolvimento, implantação e gerenciamento de aplicativos a partir de 108 Zonas de Disponibilidade dentro de 34 regiões geográficas, com planos anunciados para mais 18 Zonas de Disponibilidade e seis novas Regiões da AWS no México, Nova Zelândia, Reino da Arábia Saudita, Taiwan, Tailândia e a Nuvem Soberana Europeia da AWS. Milhões de clientes – incluindo as startups de crescimento mais rápido, as maiores empresas e as principais agências governamentais – confiam na AWS para alimentar sua infraestrutura, tornarem-se mais ágeis e reduzirem custos. Para saber mais sobre a AWS, visite aws.amazon.com.
Sobre a Amazon
A Amazon é guiada por quatro princípios: obsessão do cliente em vez de foco no concorrente, paixão pela invenção, compromisso com a excelência operacional e pensamento de longo prazo. A Amazon se esforça para ser a empresa mais centrada no cliente da Terra, o melhor empregador da Terra e o lugar mais seguro para trabalhar da Terra. Avaliações de clientes, compras com 1 clique, recomendações personalizadas, Prime, Logística pela Amazon, AWS, Kindle Direct Publishing, Kindle, Career Choice, tablets Fire, Fire TV, Amazon Echo, Alexa, tecnologia Just Walk Out, Amazon Studios e The Climate Pledge são algumas das coisas pioneiras da Amazon. Para obter mais informações, visite amazon.com/about e siga AmazonNews.