{"id":322,"date":"2023-12-01T19:07:07","date_gmt":"2023-12-01T22:07:07","guid":{"rendered":"https:\/\/devonline.net.br\/dino\/297861-aws-lanca-proxima-geracao-de-chips-proprios\/"},"modified":"2023-12-01T19:07:07","modified_gmt":"2023-12-01T22:07:07","slug":"297861-aws-lanca-proxima-geracao-de-chips-proprios","status":"publish","type":"post","link":"https:\/\/devonline.net.br\/dino\/297861-aws-lanca-proxima-geracao-de-chips-proprios\/","title":{"rendered":"AWS lan\u00e7a pr\u00f3xima gera\u00e7\u00e3o de chips pr\u00f3prios"},"content":{"rendered":"<p>A Amazon Web Services (AWS) anunciou, durante o AWS re:Invent, a nova gera&ccedil;&atilde;o de duas fam&iacute;lias de chips pr&oacute;prios &ndash; AWS Graviton4 e AWS Trainium2 &ndash;, trazendo melhorias em pre&ccedil;o e efici&ecirc;ncia energ&eacute;tica para uma ampla gama de cargas de trabalho de clientes, incluindo treinamento em machine learning (ML) e aplica&ccedil;&otilde;es de Intelig&ecirc;ncia Artificial (IA) generativa. O Graviton4 e o Trainium2 marcam as mais recentes inova&ccedil;&otilde;es em desenvolvimento de chips da AWS. &nbsp;Al&eacute;m disso, os clientes podem combinar os chip\/inst&acirc;ncias que utilizam com os mais recentes chips de terceiros, como AMD, Intel e NVIDIA &ndash; para rodar virtualmente qualquer aplica&ccedil;&atilde;o ou workload no Amazon Elastic Compute Cloud (Amazon EC2).<\/p>\n<p>O Graviton4 oferece at&eacute; 30% mais desempenho computacional, 50% mais cores e 75% mais largura de banda de mem&oacute;ria do que a atual gera&ccedil;&atilde;o de processadores Graviton3, entregando melhor desempenho de pre&ccedil;o e efici&ecirc;ncia energ&eacute;tica para uma ampla gama de cargas de trabalho rodando no Amazon EC2.<\/p>\n<p>O Trainium2 foi desenvolvido para entregar treinamentos at&eacute; 4x mais r&aacute;pidos do que a primeira gera&ccedil;&atilde;o de chips Trainium e poder&aacute; ser instalado em UltraClusters EC2 de at&eacute; 100.000 chips, viabilizando o treinamento de modelos fundacionais (FMs) e LLM (Large Language Model) em uma fra&ccedil;&atilde;o de tempo, e melhorando a efici&ecirc;ncia energ&eacute;tica em at&eacute; 2x.<\/p>\n<p>&#8220;O sil&iacute;cio sustenta todas as cargas de trabalho dos clientes, fazendo dele um elemento cr&iacute;tico de inova&ccedil;&atilde;o para a AWS&#8221;, afirmou David Brown, vice-presidente de Computa&ccedil;&atilde;o e Redes da AWS. &#8220;Ao focar o design de nossos chips em workloads reais, que de fato interessam aos clientes, conseguimos entregar a mais avan&ccedil;ada infraestrutura de nuvem para eles. O Graviton4 &eacute; a quarta gera&ccedil;&atilde;o que lan&ccedil;amos em cinco anos, e &eacute; o chip mais poderoso e de melhor efici&ecirc;ncia energ&eacute;tica que j&aacute; desenvolvemos para uma ampla gama de cargas de trabalho. E diante do crescente interesse em IA generativa, o Trainium2 ajudar&aacute; os clientes a treinarem seus modelos de ML mais rapidamente, a custos reduzidos e com melhor efici&ecirc;ncia energ&eacute;tica.&#8221;<\/p>\n<p><strong>Graviton4 eleva desempenho de pre&ccedil;o e efici&ecirc;ncia energ&eacute;tica <\/strong><\/p>\n<p>Hoje, a AWS oferece globalmente mais de 150 tipos de inst&acirc;ncias Amazon EC2 rodando Graviton, construiu mais de 2 milh&otilde;es de processadores Graviton e possui mais de 50.000 clientes &ndash; incluindo os 100 maiores clientes de ECS &ndash; utilizando inst&acirc;ncias baseadas no Graviton. Clientes como Datadog, DirecTV, Discovery, Formula 1 (F1), Nielsen, Pinterest, SAP, Snowflake, Sprinklr e Zendesk usam inst&acirc;ncias baseadas no Graviton para rodar cargas de trabalho como bancos de dados, analytics, servidores web, processamento batch, veicula&ccedil;&atilde;o de an&uacute;ncios, servidores de aplica&ccedil;&otilde;es e microsservi&ccedil;os.<\/p>\n<p>Conforme os clientes trazem mais bancos de dados in-memory e cargas de trabalho de an&aacute;lise de dados para a nuvem, suas demandas computacionais, de mem&oacute;ria, armazenamento e de redes aumentam. Como resultado, eles precisam de mais desempenho e inst&acirc;ncias ainda maiores para rodar essas cargas de trabalho. Ao mesmo tempo, precisam gerenciar custos e reduzir seu impacto ambiental com op&ccedil;&otilde;es de computa&ccedil;&atilde;o de mais efici&ecirc;ncia energ&eacute;tica. O Graviton &eacute; suportado por muitos servi&ccedil;os gerenciados da AWS, incluindo Amazon Aurora, Amazon ElastiCache, Amazon EMR, Amazon MemoryDB, Amazon OpenSearch, Amazon Relational Database Service (Amazon RDS), AWS Fargate e AWS Lambda.&nbsp;<\/p>\n<p>Os chips Trainium2 foram desenvolvidos para treinamentos de alto desempenho de FMs e LLMs com trilh&otilde;es de par&acirc;metros. O Trainium2 estar&aacute; dispon&iacute;vel nas inst&acirc;ncias Trn2 do Amazon EC2 com 16 chips em uma &uacute;nica inst&acirc;ncia. As inst&acirc;ncias Trn2 devem permitir que os clientes escalem a at&eacute; 100.000 chips Trainium2 na pr&oacute;xima gera&ccedil;&atilde;o de UltraClusters EC2, interconectados com AWS Elastic Fabric Adapter (EFA) em redes de escala petabyte, capazes de entregar at&eacute; 65 exaflops de capacidade computacional, dando aos clientes acesso sob demanda a desempenho de n&iacute;vel de supercomputadores. Com essa escalabilidade, os clientes podem treinar um LLM com 300 bilh&otilde;es de par&acirc;metros em semanas ao inv&eacute;s de meses e acelerar a pr&oacute;xima onda de avan&ccedil;os em IA generativa.<\/p>\n<p>Uma das principais defensoras do desenvolvimento respons&aacute;vel de IA generativa, a Anthropic &eacute; uma empresa de pesquisa e seguran&ccedil;a de IA. Cliente AWS desde 2021, a Anthropic lan&ccedil;ou recentemente o Claude &ndash; um assistente de IA focado em ser &uacute;til, inofensivo e honesto. &#8220;Desde o seu lan&ccedil;amento no Amazon Bedrock, o Claude tem sido rapidamente adotado pelos clientes AWS&#8221;, disse Tom Brown, cofundador da Anthropic. &#8220;Estamos trabalhando bastante pr&oacute;ximos da AWS para desenvolver nossos pr&oacute;ximos modelos fundacionais utilizando os chips Trainium. O Trainium2 nos ajudar&aacute; a criar e treinar modelos em grande escala. Esperamos que seja pelo menos 4x mais r&aacute;pido do que os chips da primeira gera&ccedil;&atilde;o do Trainium para algumas de nossas principais cargas de trabalho. Nossa colabora&ccedil;&atilde;o com a AWS ajudar&aacute; organiza&ccedil;&otilde;es de todos os tamanhos a destravar novas possibilidades &agrave; medida que utilizam os sistemas de IA inovadores da Anthropic juntamente com a tecnologia cloud segura e confi&aacute;vel da AWS.&#8221;<\/p>\n<p>Entre as empresas que utilizam os chips da AWS est&atilde;o tamb&eacute;m a Databrick, Datadog, Epic, Honeycomb e SAP HANA Cloud.<\/p>\n<p><img src='https:\/\/api.dino.com.br\/v2\/news\/tr\/297861?partnerId=4067' alt=\"\" style=\"border:0px;width:1px;height:1px;\" \/><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Os novos chips apresentam melhorias em pre\u00e7o e efici\u00eancia energ\u00e9tica para uma ampla gama de cargas de trabalho das organiza\u00e7\u00f5es, incluindo treinamento em machine learning (ML) e aplica\u00e7\u00f5es de Intelig\u00eancia Artificial (IA) generativa. <\/p>\n","protected":false},"author":2,"featured_media":323,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[22,17,3,21,12],"class_list":["post-322","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-noticias-corporativas-dino","tag-e-commerce","tag-empreendedorismo","tag-negocios","tag-startups","tag-tecnologia"],"_links":{"self":[{"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/posts\/322","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/comments?post=322"}],"version-history":[{"count":0,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/posts\/322\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/media\/323"}],"wp:attachment":[{"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/media?parent=322"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/categories?post=322"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/tags?post=322"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}