{"id":331,"date":"2023-12-04T10:09:54","date_gmt":"2023-12-04T13:09:54","guid":{"rendered":"https:\/\/devonline.net.br\/dino\/297864-aws-e-nvidia-estendem-parceria-em-ia-generativa\/"},"modified":"2023-12-04T10:09:54","modified_gmt":"2023-12-04T13:09:54","slug":"297864-aws-e-nvidia-estendem-parceria-em-ia-generativa","status":"publish","type":"post","link":"https:\/\/devonline.net.br\/dino\/297864-aws-e-nvidia-estendem-parceria-em-ia-generativa\/","title":{"rendered":"AWS e NVIDIA estendem parceria em IA generativa"},"content":{"rendered":"<p>A Amazon Web Services (AWS) e a NVIDIA anunciaram a amplia&ccedil;&atilde;o de sua parceria estrat&eacute;gica para entregar os mais avan&ccedil;ados servi&ccedil;os, infraestrutura e software capazes de acelerar as inova&ccedil;&otilde;es de Intelig&ecirc;ncia Artificial (IA) generativa a seus clientes. As empresas juntar&atilde;o as tecnologias da NVIDIA e da AWS &ndash; desde os mais novos sistemas NVIDIA multin&oacute;s com GPUs, CPUs e software de IA de &uacute;ltima gera&ccedil;&atilde;o at&eacute; a virtualiza&ccedil;&atilde;o e seguran&ccedil;a do AWS Nitro System, a interconex&atilde;o do Elastic Fabric Adapter (EFA) e a escalabilidade do UltraCluster, ideais para o treinamento de modelos fundacionais e a constru&ccedil;&atilde;o de aplica&ccedil;&otilde;es de IA generativa.<\/p>\n<p>Os principais servi&ccedil;os anunciados foram:<\/p>\n<ul>\n<li aria-level=\"1\"><strong><strong>Novas inst&acirc;ncias Amazon EC2<\/strong><\/strong><\/li>\n<\/ul>\n<p>A AWS ser&aacute; o primeiro provedor de cloud a oferecer os Superchips NVIDIA GH200 Grace Hopper com a tecnologia multin&oacute;s NVLink na nuvem. A plataforma conecta 32 Superchips Grace Hopper &agrave;s tecnologias NVIDIA NVLink e NVSwitch em uma inst&acirc;ncia e estar&aacute; dispon&iacute;vel no&nbsp;<a rel=\"nofollow noopener\" target=\"_blank\" href=\"https:\/\/cts.businesswire.com\/ct\/CT?id=smartlink&amp;url=https%3A%2F%2Faws.amazon.com%2Fec2%2F&amp;esheet=53863418&amp;newsitemid=20231127986225&amp;lan=en-US&amp;anchor=Amazon+Elastic+Compute+Cloud&amp;index=1&amp;md5=145ee8c558576f8008b63cce1b3d6828\">Amazon Elastic Compute Cloud<\/a> (Amazon EC2), conectada com os dispositivos de rede da AWS (<a rel=\"nofollow noopener\" target=\"_blank\" href=\"https:\/\/cts.businesswire.com\/ct\/CT?id=smartlink&amp;url=https%3A%2F%2Faws.amazon.com%2Fhpc%2Fefa%2F&amp;esheet=53863418&amp;newsitemid=20231127986225&amp;lan=en-US&amp;anchor=EFA&amp;index=2&amp;md5=911639ac9f4ed0bea32990ca6afd386b\">EFA<\/a>), suportados por virtualiza&ccedil;&atilde;o avan&ccedil;ada (<a rel=\"nofollow noopener\" target=\"_blank\" href=\"https:\/\/cts.businesswire.com\/ct\/CT?id=smartlink&amp;url=https%3A%2F%2Faws.amazon.com%2Fec2%2Fnitro%2F&amp;esheet=53863418&amp;newsitemid=20231127986225&amp;lan=en-US&amp;anchor=AWS+Nitro+System&amp;index=3&amp;md5=9bcc583d7e662d90d8cbe66de9eaed53\">AWS Nitro System<\/a>) e clustering de hiperescala (<a rel=\"nofollow noopener\" target=\"_blank\" href=\"https:\/\/cts.businesswire.com\/ct\/CT?id=smartlink&amp;url=https%3A%2F%2Faws.amazon.com%2Fec2%2Fultraclusters%2F&amp;esheet=53863418&amp;newsitemid=20231127986225&amp;lan=en-US&amp;anchor=Amazon+EC2+UltraClusters&amp;index=4&amp;md5=d3c64a0705c131bd95732edaeb93d715\">Amazon EC2 Ultraclusters<\/a>), permitindo que clientes conjuntos escalem para milhares de Superchips GH200. As inst&acirc;ncias AWS com GH200 NVL32 dar&atilde;o aos clientes acesso sob demanda para desempenho de n&iacute;vel de supercomputador, algo cr&iacute;tico para cargas de trabalho de IA\/ML em larga escala, que precisem ser distribu&iacute;das ao longo de m&uacute;ltiplos n&oacute;s para complexas cargas de trabalho de IA generativa &ndash; incluindo FMs (modelos fundacionais), sistemas de recomenda&ccedil;&atilde;o e bancos de dados vetoriais.<\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><strong>AWS &eacute; a primeira a hospedar a NVIDIA DGX Cloud rodando o Grace Hopper<\/strong><\/li>\n<\/ul>\n<p>A AWS ir&aacute; hospedar a&nbsp;<a rel=\"nofollow noopener\" target=\"_blank\" href=\"https:\/\/cts.businesswire.com\/ct\/CT?id=smartlink&amp;url=https%3A%2F%2Fwww.nvidia.com%2Fen-us%2Fdata-center%2Fdgx-cloud%2F&amp;esheet=53863418&amp;newsitemid=20231127986225&amp;lan=en-US&amp;anchor=NVIDIA+DGX+Cloud&amp;index=5&amp;md5=9d1ee32011e46d6468207a2fbd117c50\">NVIDIA DGX Cloud<\/a>, plataforma de treinamento em IA como servi&ccedil;o, proporcionando &agrave;s organiza&ccedil;&otilde;es acesso r&aacute;pido &agrave; supercomuta&ccedil;&atilde;o multin&oacute;s e acelerando o treinamento dos mais complexos LLMs e modelos de IA generativa, com o software <a rel=\"nofollow noopener\" target=\"_blank\" href=\"https:\/\/cts.businesswire.com\/ct\/CT?id=smartlink&amp;url=https%3A%2F%2Fwww.nvidia.com%2Fen-us%2Fdata-center%2Fproducts%2Fai-enterprise%2F&amp;esheet=53863418&amp;newsitemid=20231127986225&amp;lan=en-US&amp;anchor=NVIDIA+AI+Enterprise&amp;index=10&amp;md5=e070c5194d180e2e7b1ec3de3302c1d4\">NVIDIA AI Enterprise<\/a> integrado e acesso direto aos especialistas em IA da NVIDIA &ndash; oferecendo aos desenvolvedores a maior mem&oacute;ria compartilhada em uma &uacute;nica inst&acirc;ncia, capaz de chegar a mais de 1 trilh&atilde;o de par&acirc;metros.&nbsp;<\/p>\n<ul>\n<li aria-level=\"1\"><strong><strong>Desenvolvimento de IA na NVIDIA<\/strong><\/strong><\/li>\n<\/ul>\n<p>A NVIDIA e a AWS est&atilde;o colaborando no Projeto Ceiba para desenvolver o mais r&aacute;pido supercomputador de IA baseado em GPU, sistema em escala com GH200 NVL32 e interconex&atilde;o Amazon EFA.&nbsp; O primeiro supercomputador desse tipo &ndash; com 16.384 Superchips NVIDIA GH200 e capaz de processar 65 exaflops de IA &ndash; ser&aacute; utilizado para impulsionar a pr&oacute;xima onda de inova&ccedil;&atilde;o em IA generativa. O supercomputador ser&aacute; integrado a servi&ccedil;os da AWS como a solu&ccedil;&atilde;o de rede criptografada Amazon Virtual Private Cloud (VPC) e o servi&ccedil;o de storage de alta performance Amazon Elastic Block Store. A NVIDIA utilizar&aacute; o supercomputador para avan&ccedil;ar em IA para LLMs, gr&aacute;ficos e simula&ccedil;&atilde;o, biologia digital, rob&oacute;tica, carros aut&ocirc;nomos, previs&atilde;o do clima no Earth 2 e muito mais.<\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><strong>Desenvolvimento de IA generativa, HPC, design e simula&ccedil;&atilde;o<\/strong><\/li>\n<\/ul>\n<p>A fim de estimular o desenvolvimento, o treinamento e a infer&ecirc;ncia dos maiores LLMs, as inst&acirc;ncias P5e da AWS utilizar&atilde;o a mais recente GPU H200 da NVIDIA para oferecer 141 GB de mem&oacute;ria GPU HBM3e, que &eacute; 1,8x maior e 1,4x mais r&aacute;pida do que as GPUs H100.&nbsp;<\/p>\n<p>A AWS tamb&eacute;m anunciou novas inst&acirc;ncias Amazon EC2 G6e com GPUs NVIDIA L40S e inst&acirc;ncias G6 com GPUs L4 para entregar solu&ccedil;&otilde;es com efici&ecirc;ncia energ&eacute;tica para cargas de trabalho de gr&aacute;ficos, IA e v&iacute;deo.&nbsp;<\/p>\n<p>As inst&acirc;ncias G6 foram constru&iacute;das para lidar com cargas de trabalho complexas, como IA generativa e aplica&ccedil;&otilde;es de g&ecirc;meos digitais.&nbsp;Com o NVIDIA Omniverse &eacute; poss&iacute;vel desenvolver, contextualizar e aprimorar simula&ccedil;&otilde;es 3D realistas utilizando dados em tempo real.<\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><strong>Software NVIDIA na AWS acelera o desenvolvimento de IA generativa<\/strong><\/li>\n<\/ul>\n<p>O software NVIDIA na AWS est&aacute; ajudando a Amazon a trazer mais inova&ccedil;&otilde;es aos seus servi&ccedil;os e opera&ccedil;&otilde;es. A AWS est&aacute; usando o framework NVIDIA NeMO para treinar LLMs Amazon Titans selecionados. O Amazon Robotics come&ccedil;ou a usar o NVIDIA Omniverse Isaac para construir g&ecirc;meos digitais para automatizar, otimizar e planejar seus centros de distribui&ccedil;&atilde;o aut&ocirc;nomos em ambientes virtuais antes de implement&aacute;-los no mundo real. O NVIDIA BioNeMO, dispon&iacute;vel agora no Amazon SageMaker e planejado para ser oferecido na AWS por meio do NVIDIA DGX Cloud, permite que empresas farmac&ecirc;uticas acelerem o descobrimento de medicamentos ao simplificar e acelerar o treinamento de modelos utilizando seus pr&oacute;prios dados.&nbsp;<\/p>\n<p>&#8220;A IA generativa est&aacute; transformando os workloads em nuvem e colocando a computa&ccedil;&atilde;o acelerada no centro da gera&ccedil;&atilde;o de conte&uacute;dos diversos&#8221;, disse Jensen Huang, fundador e CEO da NVIDIA. &#8220;Conduzidos pela miss&atilde;o comum de entregar o estado da arte em IA generativa, com efici&ecirc;ncia de custo para todos os clientes, a NVIDIA e a AWS est&atilde;o colaborando ao longo de toda a cadeia de computa&ccedil;&atilde;o, incluindo infraestrutura de IA, bibliotecas de acelera&ccedil;&atilde;o, modelos fundacionais e servi&ccedil;os de IA generativa.&#8221;<\/p>\n<p>&#8220;A AWS e a NVIDIA trabalham em conjunto h&aacute; mais de 13 anos, come&ccedil;ando pela primeira inst&acirc;ncia GPU em nuvem. Hoje, oferecemos a mais ampla gama de solu&ccedil;&otilde;es GPU da NVIDIA para cargas de trabalho como gr&aacute;ficos, jogos, computa&ccedil;&atilde;o de alto desempenho, machine learning e, agora, IA generativa&#8221;, disse Adam Selipsky, CEO da AWS. &#8220;Continuamos inovando com a AWS para torn&aacute;-la o melhor lugar para se rodar GPUs, combinando a pr&oacute;xima gera&ccedil;&atilde;o de Superchips NVIDIA Grace Hopper com as capacidades de rede do AWS EFA, de clustering em grande escala do EC2 UltraClusters e de virtualiza&ccedil;&atilde;o avan&ccedil;ada do Nitro.&#8221;<\/p>\n<p><img src='https:\/\/api.dino.com.br\/v2\/news\/tr\/297864?partnerId=4067' alt=\"\" style=\"border:0px;width:1px;height:1px;\" \/><\/p>\n","protected":false},"excerpt":{"rendered":"<p>A colabora\u00e7\u00e3o baseia-se em um relacionamento de longa data que impulsionou a era da IA generativa, oferecendo aos pioneiros do Machine Learning (ML) o desempenho computacional necess\u00e1rio para avan\u00e7ar no estado da arte nessas tecnologias.<\/p>\n","protected":false},"author":2,"featured_media":332,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[17,3,21,12],"class_list":["post-331","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-noticias-corporativas-dino","tag-empreendedorismo","tag-negocios","tag-startups","tag-tecnologia"],"_links":{"self":[{"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/posts\/331","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/comments?post=331"}],"version-history":[{"count":0,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/posts\/331\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/media\/332"}],"wp:attachment":[{"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/media?parent=331"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/categories?post=331"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/devonline.net.br\/dino\/wp-json\/wp\/v2\/tags?post=331"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}