Alex Ferraz

Nova geração do Amazon SageMaker oferece plataforma unificada para dados, análises e IA

No AWS re:Invent, a Amazon Web Services, Inc. (AWS), uma empresa da Amazon.com, Inc. (NASDAQ: AMZN), anunciou a próxima geração do Amazon SageMaker, unificando os recursos que os clientes precisam para análises SQL rápidas, processamento de big data em escala de petabytes, exploração e integração de dados, desenvolvimento e treinamento de modelos e inteligência artificial generativa (IA) em uma plataforma integrada.

O novo SageMaker Unified Studi ajuda os clientes a encontrarem e acessarem dados de toda a organização e reúne recursos de análise, machine learning (ML) e IA da AWS desenvolvidos para esse fim, para que os clientes possam agir em seus dados usando a melhor ferramenta para o trabalho em todos os tipos de casos de uso de dados comuns, auxiliados pelo Amazon Q Developer ao longo do caminho.

O SageMaker Catalog e os recursos de governança integrados permitem que os usuários certos acessem os dados, modelos e artefatos de desenvolvimento corretos para o devido propósito.

O novo SageMaker Lakehouse unifica dados em data lakes, data warehouses, bancos de dados operacionais e aplicativos corporativos, facilitando o acesso e o trabalho com dados de dentro do SageMaker Unified Studio e usando ferramentas familiares de IA e ML ou mecanismos de consulta compatíveis com o Apache Iceberg.

AWS re:Invent 2024Photo by Noah Berger

Novas integrações zero-ETL com aplicativos líderes de Software-as-a-Service (SaaS) facilitam o acesso a dados de aplicativos SaaS de terceiros no SageMaker Lakehouse e Amazon Redshift para análises ou ML sem pipelines de dados complexos.

Clientes e parceiros, incluindo Adastra, Confluent, Etleap, idealista, Informatica, Lennar, Natera, NatWest Group, NTT Data, Roche, Tableau e outros, já estão explorando a próxima geração do SageMaker para reunir suas iniciativas de dados, análises e IA.

“Estamos vendo uma convergência de análise e IA, com clientes usando dados de maneiras cada vez mais interconectadas — de análise histórica a treinamento de modelo de ML e aplicativos de IA generativa”, disse Swami Sivasubramanian, vice-presidente de Dados e IA da AWS. “Para dar assistência a essas cargas de trabalho, muitos clientes já usam combinações de nossas ferramentas de análise e ML desenvolvidas para esse propósito, como o Amazon SageMaker — o padrão real para trabalhar com dados e construir modelos de ML — Amazon EMR, Amazon Redshift, data lakes do Amazon S3 e AWS Glue. A próxima geração do SageMaker reúne esses recursos — junto com alguns novos recursos interessantes — para dar aos clientes todas as ferramentas de que precisam para processamento de dados, análise de SQL, desenvolvimento e treinamento de modelo de ML e IA generativa, diretamente no SageMaker.”

Crie mais rápido

Hoje, centenas de milhares de clientes usam o SageMaker para criar, treinar e implantar modelos de ML. Muitos clientes também contam com o conjunto abrangente de serviços de análise desenvolvidos especificamente pela AWS para dar assistência a uma ampla variedade de cargas de trabalho, incluindo análise de SQL e de pesquisa, processamento de big data e análise de streaming. Cada vez mais, os clientes não estão usando essas ferramentas isoladamente; em vez disso, usam uma combinação de análise, ML e IA generativa para obter insights e potencializar novas experiências para seus usuários. Esses clientes se beneficiariam de um ambiente unificado que reúne ferramentas familiares da AWS para análise, ML e IA generativa, juntamente com fácil acesso a todos os seus dados e a capacidade de participar em projetos de dados com outros membros de sua equipe ou organização.

A próxima geração do SageMaker inclui um novo estúdio unificado que oferece aos clientes um único ambiente de desenvolvimento de dados e IA, no qual os usuários podem encontrar e acessar todos os dados em sua organização, agir sobre eles usando a melhor ferramenta para o trabalho em todos os tipos de casos comuns e participar dentro de equipes e entre funções para dimensionar seus dados e iniciativas de IA. O SageMaker Unified Studio reúne funcionalidades e ferramentas da gama de “estúdios” autônomos, editores de consultas e ferramentas visuais que os clientes desfrutam hoje no Amazon Bedrock, Amazon EMR, Amazon Redshift, AWS Glue e no SageMaker Studio existente. Isso torna mais fácil para os clientes acessarem e usarem esses recursos para descobrir e preparar dados, criar consultas ou códigos, processar dados e construir modelos de ML. O Amazon Q Developer auxilia ao longo do caminho para dar assistência para tarefas de desenvolvimento, como descoberta de dados, codificação, geração de SQL e integração de dados.

Desta forma, um usuário pode perguntar ao Amazon Q, por exemplo: “Quais dados devo usar para ter uma ideia melhor das vendas de produtos?” ou “Gerar um SQL para calcular a receita total por categoria de produto”. Os usuários podem publicar e compartilhar com segurança dados, modelos, aplicativos e outros artefatos com membros de sua equipe ou organização, acelerando assim a descoberta e o uso dos ativos de dados. Com o ambiente de desenvolvimento integrado (IDE) do Amazon Bedrock no SageMaker Unified Studio, os usuários podem criar e implantar aplicativos de IA generativos de forma rápida e fácil usando a seleção de modelos e ferramentas de base de alto desempenho do Amazon Bedrock, como Agentes, Guardrails, Bases de Conhecimento e Fluxos. O SageMaker Unified Studio vem com recursos de descoberta, compartilhamento e governança de dados integrados, para que analistas, cientistas de dados e engenheiros possam pesquisar e encontrar facilmente os dados certos de que precisam para seu caso de uso, ao mesmo tempo em que aplicam os controles e permissões de segurança desejados, mantendo o controle de acesso e protegendo seus dados.

O NatWest Group, um banco líder no Reino Unido que atende a mais de 19 milhões de clientes, usa várias ferramentas para engenharia de dados, análise de SQL, ML e cargas de trabalho de IA generativa. Com o SageMaker Unified Studio, o NatWest Group terá um único ambiente unificado em toda a organização para dar assistência a essas cargas de trabalho e prevê uma redução de 50% no tempo necessário para que seus usuários de dados acessem recursos de análise e IA permitindo que gastem menos tempo gerenciando vários serviços e mais tempo inovando para seus clientes.

Governança de dados e IA

A próxima geração do SageMaker simplifica a descoberta, a governança e a participação dos dados e IA em uma organização. Com o SageMaker Catalog, criado no Amazon DataZone, os administradores podem definir e implementar políticas de acesso consistentes usando um único modelo de permissão com controles granulares, enquanto os trabalhadores de dados de todas as equipes podem descobrir e acessar com segurança dados e modelos aprovados enriquecidos com metadados de contexto de negócios criados por IA generativa. Os administradores podem definir e aplicar permissões facilmente em modelos, ferramentas e fontes de dados, enquanto proteções personalizadas ajudam a tornar os aplicativos de IA seguros e compatíveis. Os clientes também podem proteger seus modelos de IA com classificação de dados, detecção de toxicidade, guardrails e políticas de IA responsáveis ​​no SageMaker.

Reduza os silos de dados

Mais de um milhão de data lakes são criados no Amazon Simple Storage Service (Amazon S3), permitindo que os clientes centralizem seus ativos de dados e obtenham valor com ferramentas de análise, IA e ML da AWS. Os data lakes possibilitam que os clientes armazenem seus dados como estão, facilitando a sua combinação por várias fontes. Os clientes podem ter dados espalhados em vários data lakes, bem como em um data warehouse, e se beneficiariam de uma maneira simples de unifica-los.

O SageMaker Lakehouse fornece acesso unificado aos dados armazenados em data lakes do Amazon S3, data warehouses do Redshift e fontes de dados federadas, reduzindo silos de dados e facilitando a consulta, não importa como e onde eles estejam fisicamente armazenados. Com esse novo recurso de lakehouse compatível com Apache Iceberg no SageMaker, os clientes podem acessar e trabalhar com todos os seus dados de dentro do SageMaker Unified Studio, bem como com ferramentas familiares de IA e ML e mecanismos de consulta compatíveis com os padrões abertos do Apache Iceberg. Agora, os clientes podem usar suas ferramentas preferidas de análise e ML em seus dados, não importa como e onde eles estejam fisicamente armazenados, para dar assistência em casos de uso, incluindo análise de SQL, consulta ad-hoc, ciência de dados, ML e IA generativa. O SageMaker Lakehouse fornece controles de acesso integrados e detalhados que são aplicados consistentemente em todos os dados em todas as ferramentas de análise e IA no lakehouse, permitindo que os clientes definam permissões uma vez e compartilhem informações com segurança em sua organização.

Roche, pioneira global em produtos farmacêuticos e diagnósticos focada no avanço da ciência para melhorar a vida das pessoas, usará o SageMaker Lakehouse para unificar dados dos data lakes Redshift e Amazon S3, eliminando silos de dados, aprimorando a interoperabilidade entre equipes e permitindo que os usuários aproveitem sem interrupção, sem a necessidade de sua movimentação dispendiosa ou controles de acesso de segurança duplicados. Com o SageMaker Lakehouse, a Roche prevê uma redução de 40% no tempo de processamento de dados, permitindo que eles se concentrem mais em impulsionar seus negócios e menos no gerenciamento de dados.

Acesse dados SaaS de forma rápida e fácil

Para realmente aproveitar os dados em suas operações, as empresas precisam de acesso contínuo a todos, independentemente de sua localização. É por isso que a AWS investiu em um futuro zero-ETL, no qual a integração de dados não é mais um esforço manual e tedioso, e os clientes podem facilmente obter seus dados onde precisam. Isso inclui integrações zero-ETL para Amazon Aurora MySQL e PostgreSQL, Amazon RDS para MySQL e Amazon DynamoDB com Amazon Redshift, que ajudam os clientes a acessarem dados de forma rápida e fácil de bancos de dados relacionais e não relacionais populares no Redshift e SageMaker Lakehouse para análise e ML. Além de bancos de dados operacionais e data lakes, muitos clientes também têm dados empresariais críticos armazenados em aplicativos SaaS e se beneficiariam do fácil acesso a esses dados para análise e ML.

As novas integrações zero-ETL com aplicativos SaaS facilitam o acesso dos clientes aos seus dados de aplicativos como Zendesk e SAP no SageMaker Lakehouse e Redshift para análise e IA. Isso elimina a necessidade de pipelines de dados, que podem ser desafiadores e caros para construir, complexos para gerenciar e propensos a erros que podem atrasar o acesso a insights sensíveis ao tempo. As integrações zero-ETL para aplicativos SaaS incorporam as melhores práticas para sincronização completa de dados, detecção de atualizações e exclusões incrementais e operações de mesclagem de destino.

Organizações de todos os tamanhos e setores, incluindo Infosys, Intuit e Woolworths, já estão se beneficiando das integrações zero-ETL da AWS para conectar e analisar dados de forma rápida e fácil sem construir e gerenciar pipelines. Com as integrações zero-ETL para aplicativos SaaS, por exemplo, a plataforma imobiliária online idealista poderá simplificar seus processos de extração e ingestão de dados, eliminando a necessidade de vários pipelines para acessar dados armazenados em aplicativos SaaS de terceiros e liberando sua equipe de engenharia de dados para se concentrar em derivar insights acionáveis ​​de dados em vez de construir e gerenciar infraestrutura.

A próxima geração do SageMaker está disponível hoje. O SageMaker Unified Studio está atualmente em visualização e será disponibilizado em breve.

Sobre a Amazon Web Services

Desde 2006, a Amazon Web Services tem sido a nuvem mais abrangente e amplamente adotada do mundo. A AWS vem expandindo continuamente seus serviços para suportar praticamente qualquer carga de trabalho, e agora possui mais de 240 serviços completos para computação, armazenamento, bancos de dados, redes, análises, aprendizado de máquina e inteligência artificial (IA), Internet das Coisas (IoT), dispositivos móveis, segurança, híbrido, mídia e desenvolvimento, implantação e gerenciamento de aplicativos a partir de 108 Zonas de Disponibilidade dentro de 34 regiões geográficas, com planos anunciados para mais 18 Zonas de Disponibilidade e seis novas Regiões da AWS no México, Nova Zelândia, Reino da Arábia Saudita, Taiwan, Tailândia e a Nuvem Soberana Europeia da AWS. Milhões de clientes – incluindo as startups de crescimento mais rápido, as maiores empresas e as principais agências governamentais – confiam na AWS para alimentar sua infraestrutura, tornarem-se mais ágeis e reduzirem custos. Para saber mais sobre a AWS, visite aws.amazon.com.

Sobre a Amazon

A Amazon é guiada por quatro princípios: obsessão do cliente em vez de foco no concorrente, paixão pela invenção, compromisso com a excelência operacional e pensamento de longo prazo. A Amazon se esforça para ser a empresa mais centrada no cliente da Terra, o melhor empregador da Terra e o lugar mais seguro para trabalhar da Terra. Avaliações de clientes, compras com 1 clique, recomendações personalizadas, Prime, Logística pela Amazon, AWS, Kindle Direct Publishing, Kindle, Career Choice, tablets Fire, Fire TV, Amazon Echo, Alexa, tecnologia Just Walk Out, Amazon Studios e The Climate Pledge são algumas das coisas pioneiras da Amazon. Para obter mais informações, visite amazon.com/about e siga AmazonNews.

Sair da versão mobile