Computex: Intel acelera a IA em todos os lugares, redefine potência, desempenho e preços acessíveis

A man in a suit holds up a small electronic component on stage, with a futuristic blue and white background. The scene suggests a technology presentation or conference.

At Computex Taiwan, Intel CEO Pat Gelsinger discusses the vast opportunities ahead and the Intel innovation that’s bringing AI everywhere. During the event in June 2024, Intel unveiled cutting-edge technologies and architectures poised to accelerate the artificial intelligence ecosystem. (Credit: Intel Corporation)

Com os processadores Intel Xeon 6, aceleradores Gaudi e arquitetura Lunar Lake, a Intel oferece o melhor da IA em soluções de nuvem, rede, cliente e borda.

TAIPEI, Taiwan, 4 de junho de 2024 — Hoje na Computex, a Intel revelou tecnologias e arquiteturas inovadoras prontas para acelerar drasticamente o ecossistema de IA, desde data center, nuvem e rede até a borda e o PC. Com mais poder de processamento, eficiência energética de ponta e baixo custo total de propriedade (TCO, em inglês), os clientes agora podem aproveitar a oportunidade completa do sistema de IA.

Destaques das notícias:

  • Lança processadores Intel® Xeon® 6 com Efficient-cores (E-cores), oferecendo desempenho e eficiência energética para cargas de trabalho escaláveis ​​e de alta densidade no data center. Permite consolidação de rack de 3:1, ganhos de desempenho no nível de rack de até 4,2x e ganhos de desempenho por watt de até 2,6x1.
  • Anuncia preços para os kits de acelerador de IA Intel® Gaudi® 2 e Intel® Gaudi® 3, proporcionando alto desempenho com um terço de custo menor em comparação com plataformas concorrentes2. A combinação de processadores Xeon com aceleradores Gaudi AI em um sistema oferece uma solução poderosa para tornar a IA mais rápida, mais barata e mais acessível.
  • Revela a arquitetura do processador para clientes Lunar Lake para continuar a crescer na categoria AI PC. A próxima geração de PCs com IA , com eficiência energética inovadora x86 e compatibilidade sem comprometimentos com aplicações, proporcionará uma potência de sistema em chip (SoC) até 40% menor em comparação com a geração anterior3.

 

"A IA está impulsionando uma das eras de inovação mais importantes que a indústria já viu”, diz o CEO da Intel, Pat Gelsinger. "A magia do silício está, mais uma vez, permitindo avanços exponenciais na computação que empurrarão os limites do potencial humano e impulsionarão a economia global nos futuros anos."

Mais: Intel na Computex 2024 (Press Kit)

Gelsinger continuou: "A Intel é uma das únicas empresas do mundo inovando em todo o espectro de oportunidades do mercado de IA , desde a fabricação de semicondutores até sistemas de PC, rede, borda e data center. Nossas mais recentes plataformas Xeon, Gaudi e Core Ultra, combinadas com o poder de nosso ecossistema de hardware e software, estão oferecendo as soluções flexíveis, seguras, sustentáveis e econômicas que nossos clientes precisam para maximizar as imensas oportunidades pela frente".

Intel habilita a IA em qualquer lugar

Durante sua palestra na Computex, Gelsinger destacou os benefícios dos padrões abertos e do poderoso ecossistema da Intel, ajudando a acelerar a oportunidade de IA. Ele foi acompanhado por letrados e empresas líderes do setor expressando apoio, incluindo o presidente e CEO da Acer, Jason Chen, o presidente da ASUS Jonney Shih, o presidente e CEO da Microsoft, Satya Nadella, e o presidente da Inventec, Jack Tsai, entre outros.

Gelsinger e outros deixaram claros que a Intel está revolucionando a inovação em IA e oferecendo tecnologias de última geração antes do previsto. Em apenas seis meses, a empresa passou de lançar processadores Intel® Xeon® da 5ª Geração para apresentar o membro inaugural da família Xeon 6; desde a visualização dos aceleradores Gaudi AI até a oferta de clientes corporativos um sistema de treinamento e inferência gerativo de IA gerativa (GenAI) econômico e de alto desempenho; e desde a inauguração da era dos PCs de IA com Intel® Core™ Ultra processadores em mais de 8 milhões de dispositivos, até a revelação da próxima arquitetura de clientes programada para lançamento no final deste ano.

Com esses desenvolvimentos, a Intel está acelerando a execução enquanto amplia os limites da inovação e da velocidade de produção para democratizar os setores de IA e catalisar.

Download de todas as imagens (ZIP, 26 MB)

Modernizando o data center para IA: os processadores Intel Xeon 6 melhoram o desempenho e a eficiência energética para cargas de trabalho de alta densidade e expansão horizontal

À medida que as transformações digitais aceleram, as empresas enfrentam pressões crescentes para atualizar seus antigos sistemas de data center para capturar a economia de custos, alcançar metas de sustentabilidade, maximizar o espaço físico e o espaço em rack e criar novos recursos digitais em toda a empresa.

Toda a plataforma Xeon 6 e família de processadores são criadas para abordar esses desafios com SKUs E-core (Efficient-core) e P-core (Performance-core) para abordar a ampla variedade de casos de uso e cargas de trabalho, desde IA e outras necessidades de computação de alto desempenho até aplicações nativas na nuvem escaláveis. Ambos os E-cores e P-cores são construídos com uma arquitetura compatível com uma pilha de software compartilhada e um ecossistema aberto de fornecedores de hardware e software.

O primeiro dos processadores Xeon 6 a ser lançado é o Intel Xeon 6 E-core (codinome Sierra Forest), que está disponível a partir de hoje. O Xeon 6 P-cores (codinome Granite Rapids) deve ser lançado no próximo trimestre.

Com alta densidade de núcleo e desempenho excepcional por watt, o Intel Xeon 6 E-core oferece computação eficiente com custos de energia significativamente menores. O desempenho aprimorado com maior eficiência energética é perfeito para as mais exigentes cargas de trabalho de alta densidade e escalonamento, incluindo aplicações nativas na nuvem e redes de entrega de conteúdo, microsserviços de rede e serviços digitais de consumo.

Além disso, o Xeon 6 E-core possui enormes vantagens de densidade, permitindo a consolidação do nível de rack de 3 a 1, oferecendo aos clientes um ganho de desempenho de nível de rack de até 4,2x e ganho de desempenho por watt de até 2,6x em comparação com os processadores Intel® Xeon® da 2ª Geração em cargas de trabalho de transcodificação de mídia1. Usando menos energia e espaço em rack, os processadores Xeon 6 liberam capacidade e infraestrutura de computação para novos projetos inovadores de IA.

Ficha técnica: processadores Intel Xeon 6

Download de todas as imagens (ZIP, 27 MB)

Fornecendo GenAI de alto desempenho a um custo total significativamente menor com aceleradores Intel Gaudi AI

Hoje, aproveitar o poder da IA generativa torna-se mais rápido e menos caro. Como a escolha dominante da infraestrutura, o x86 opera em escala em quase todos os ambientes de data center, servindo como base para integrar o poder da IA enquanto garante a interoperabilidade econômica e os tremendos benefícios de um ecossistema aberto de desenvolvedores e clientes.

Intel Xeon processadores são o nó de cabeça da CPU ideal para cargas de trabalho de IA e operam em um sistema com aceleradores Intel Gaudi AI, que são projetados especificamente para cargas de trabalho de IA. Juntos, esses dois oferecem uma solução poderosa que se integra perfeitamente à infraestrutura existente.

Como a única alternativa com parâmetros de referência do MLPerf à Nvidia H100 para treinamento e inferência de grandes modelos de linguagem (LLM), a arquitetura Gaudi oferece aos clientes o desempenho de GenAI que buscam com uma vantagem de preço-desempenho que oferece escolhas e tempo de implantação rápido com menor custo total de operação.

Um kit de IA padrão, incluindo oito aceleradores Intel Gaudi 2 com uma placa base universal (UBB) oferecida a provedores de sistemas a US$ 65.000, é estimado em um terço do custo de plataformas competitivas comparáveis. Um kit que inclui oito aceleradores Intel Gaudi 3 com uma UBB será listado em US$ 125.000, estimado em dois terços do custo de plataformas competitivas comparáveis4.

Os aceleradores Intel Gaudi 3 fornecerão melhorias significativas de desempenho para tarefas de treinamento e inferência em modelos GenAI líderes, ajudando as empresas a liberar o valor em seus dados proprietários. O Intel Gaudi 3 em um cluster de 8.192 aceleradores é projetado para oferecer um tempo de treinamento5 até 40% mais rápido em comparação com o cluster da GPU Nvidia H100 de tamanho equivalente e taxa de transferência de treinamento até 15% mais rápida para um cluster de 64 aceleradores em comparação com o Nvidia H100 no modelo Llama2-70B. Além disso, o Intel Gaudi 3 é projetado para oferecer uma inferência até 2x mais rápida7 em comparação com a Nvidia H100, executando LLMs populares como Llama-70B e Mistral-7B.

Para disponibilizar esses sistemas de IA amplamente, a Intel está colaborando com pelo menos 10 grandes provedores globais de sistemas, incluindo seis novos fornecedores que anunciaram que estão trazendo a Intel Gaudi 3 ao mercado. Os novos colaboradores de hoje incluem Asus, Foxconn, Gigabyte, Inventec, Quanta e Wistron, expandindo as ofertas de produção dos principais fornecedores de sistemas Dell, Hewlett Packard Enterprise, Lenovo e Supermicro.

Download de todas as imagens (ZIP, 7 MB)

Aceleração da IA no dispositivo para PCs notebooks; A nova arquitetura oferece 3x mais computação de IA e incrível eficiência energética

Além do data center, a Intel está escalando seu espaço de IA na borda e no PC. Com mais de 90.000 implantações de borda e 200 milhões de CPUs entregues ao ecossistema, a Intel permitiu a escolha empresarial por décadas.

Hoje, a categoria de PCs de IA está transformando todos os aspectos da experiência de computação, e a Intel está na vanguarda deste momento de criação de categorias. Não se trata mais apenas de velocidades de processamento mais rápidas ou de designs mais elegantes, mas sim criar dispositivos de borda que aprendem e evoluem em tempo real – antecipando as necessidades do usuário, adaptando-se às suas preferências e anunciando uma era totalmente nova de produtividade, eficiência e criatividade.

A projeção de PCs de IA é de 80% do mercado de PCs até 2028, de acordo com Boston Consulting Group. Em resposta, a Intel se moveu rapidamente para criar a melhor plataforma de hardware e software para o PC de IA, permitindo que mais de 100 fornecedores independentes de software (ISVs), 300 recursos e suporte de 500 modelos de IA em toda a sua plataforma Core Ultra.

Ampliando rapidamente essas vantagens incomparáveis, a empresa revelou hoje os detalhes arquitetônicos da Lunar Lake – o processador carro-chefe para a próxima geração de PCs de IA. Com um salto maciço no poder de processamento de gráficos e IA, e um foco no desempenho de computação com eficiência energética para o segmento fino e leve, a Lunar Lake fornecerá uma potência SoC3 até 40% menor e mais de 3 vezes a computação de IA8. Espera-se que seja enviado no terceiro trimestre de 2024, a tempo para a temporada de compras de férias.

A arquitetura totalmente nova do Lunar Lake permitirá:

  • Os novos Performance-cores (P-cores) e Efficient-cores (E-cores) oferecem melhorias significativas no desempenho e na eficiência energética.
  • Uma unidade de processamento neural (NPU) Intel® de quarta geração com até 48 tera-operações por segundo (TOPS) de desempenho de IA. Essa NPU poderosa oferece até 4x mais computação de IA em relação à geração anterior, permitindo melhorias correspondentes na IA gerativa.
  • O novo design da GPU com tecnologia Xe2 combina inovações: núcleos Xe de segunda geração com Xe Matrix Extension (XMX) para IA, unidades de ray tracing aprimoradas, decodificação de hardware de baixo consumo de energia para a nova tecnologia de codec de vídeo VVC e suporte para os mais recentes painéis eDP 1.5. Os núcleos da GPU Xe2 melhoram o desempenho de jogos e gráficos em 1,5x em relação à geração anterior, enquanto os novos arrays XMX permitem um segundo acelerador de IA com até 67 TOPS de desempenho para uma taxa de transferência extraordinária na criação de conteúdo de IA.
  • Ilha avançada de baixo consumo, um novo cluster de computação e inovação da Intel que lida com tarefas de segundo plano e produtividade com extrema eficiência, permitindo uma incrível autonomia da bateria de notebook.

Enquanto outros se preparam para entrar no mercado de PCs de IA, a Intel já está enviando em escala, oferecendo mais processadores de PC de IA até o primeiro trimestre de 2024 do que todos os concorrentes juntos. Lunar Lake está definido para alimentar mais de 80 projetos diferentes de PC de IA de 20 fabricantes de equipamentos originais (OEMs). A Intel espera implantar mais de 40 milhões de processadores Core Ultra no mercado este ano.

Ficha técnica: Intel revela a arquitetura Lunar Lake

Como Gordon Moore disse famosamente: "O que quer que tenha sido feito, pode ser superado", e a Intel é a vanguarda desta busca implacável do progresso. Com escala global que abrange cliente, borda, data center e nuvem, um ecossistema robusto a base em padrões abertos e soluções poderosas e econômicas, a Intel não está apenas alimentando IA em todos os lugares; está moldando seu futuro. Os anúncios de hoje não são apenas um salto tecnológico, mas um convite aos clientes e parceiros para aproveitar possibilidades sem precedentes e ser pioneiro na próxima era de suas próprias inovações.

Declarações Prévias

Esta versão contém declarações prospectivas que envolvem diversos riscos e incertezas, inclusive no que diz respeito ao roteiro dos produtos da Intel e às vendas e competitividade de produtos antecipadas e ao crescimento e tendências projetadas de mercados relevantes para os negócios da Intel. Tais declarações envolvem muitos riscos e incertezas que podem fazer com que nossos resultados reais diferem materialmente daqueles expressos ou implícitos, incluindo os associados a:

  • o alto nível de concorrência e as rápidas mudanças tecnológicas em nosso setor;
  • os investimentos significativos a longo prazo e inerentemente arriscados que estamos fazendo em instalações de P&D e manufatura que podem não obter um retorno favorável;
  • as complexidades e incertezas no desenvolvimento e implementação de novos produtos semicondutores e tecnologias de processo de fabricação;
  • nossa capacidade de cronometrar e escalar nossos investimentos de capital adequadamente e com sucesso garantir arranjos de financiamento alternativos favoráveis e concessões governamentais;
  • implementando novas estratégias de negócios e investindo em novos negócios e tecnologias;
  • mudanças na demanda por nossos produtos;
  • Condições macroeconômicas e tensões geopolíticas e conflitos, incluindo tensões geopolíticas e comerciais entre os EUA e a China, os impactos da guerra da Rússia contra a Ucrânia, tensões e conflitos que afetam Israel e Oriente Médio, e o aumento das tensões entre a China e Taiwan continental;
  • o mercado em evolução de produtos com capacidades de IA;
  • nossa complexa cadeia de fornecimento global, incluindo de interrupções, atrasos, tensões comerciais e conflitos, ou escassez;
  • defeitos de produtos, errata e outros problemas de produtos, particularmente quando desenvolvemos produtos de última geração e implementamos tecnologias de processo de fabricação de última geração;
  • potencial vulnerabilidades de segurança em nossos produtos;
  • ameaças de segurança cibernética em constante evolução e riscos à privacidade;
  • Os riscos de IP, incluindo litígios relacionados e processos regulatórios;
  • a necessidade de atrair, reter e motivar os principais talentos;
  • transações e investimentos estratégicos;
  • riscos relacionados a vendas, incluindo a concentração de clientes e o uso de distribuidores e de outros terceiros;
  • nosso retorno de capital significativamente reduzido nos últimos anos;
  • nossas obrigações de dívida e nossa capacidade de acessar fontes de capital;
  • leis e regulamentações complexas e em evolução em várias jurisdições;
  • flutuações nas taxas de câmbio;
  • mudanças em nossa taxa efetiva;
  • eventos catastróficos;
  • regulamentações ambientais, de saúde, de segurança e de produtos;
  • nossas iniciativas e novos requisitos legais relacionados a assuntos de responsabilidade corporativa; E
  • outros riscos e incertezas descritos nesta versão, nosso formulário de 10-K de 2023 e nossos outros arquivos com a SEC.

Dado esses riscos e incertezas, os leitores são advertidos a não depositar confiança indevida em tais declarações prospectivas. Os leitores são instados a analisar cuidadosamente e considerar as várias divulgações feitas nesta versão e em outros documentos que registramos de tempos em tempos com a SEC que divulgam riscos e incertezas que podem afetar nossos negócios.

A menos que especificamente indicado de outra forma, as declarações prospectivas nesta versão são baseadas nas expectativas da administração a partir da data desta versão, a menos que uma data anterior seja especificada, incluindo expectativas baseadas em informações e projeções de terceiros que o gerenciamento acredita serem respeitáveis. Não nos comprometemos e renunciamos expressamente a qualquer obrigação de atualizar tais declarações, seja como resultado de novas informações, novos desenvolvimentos ou de outra forma, exceto enquanto a divulgação possa ser exigida por lei.

Nota do Editor: As reivindicações relativas à GPU Xe2 foram atualizadas em 4 de junho de 2024.

Isenções de responsabilidade:

A IA funciona melhor com a Intel no conjunto de computação, desde o data center, nuvem e rede até a borda e PC em maio de 2024, com base em ampla compatibilidade, amplas opções de software, arquitetura exclusiva e desempenho impressionante das ofertas da Intel, que se combinam para oferecer a melhor experiência geral de IA, inclusive em comparação com ofertas competitivas. Consulte intel.com/performanceindex para obter detalhes. Os resultados podem variar.

Consulte [7T1] no intel.com/processorclaims: Intel® Xeon® 6. Os resultados podem variar.

Estimativas de preços baseadas em informações disponíveis ao público e análise interna da Intel.

Isenção de responsabilidade para nota de rodapé: As medições de energia são baseadas na plataforma de referência Lunar Lake usando o YouTube 4K 30fps AV1. Consulte o backup para obter detalhes. Os resultados podem variar.

A orientação de preço para cartões e sistemas é apenas para fins de modelagem. Consulte o fabricante do equipamento original (OEM- "original equipment manufacturer") para obter os preços finais. Os resultados podem variar com base em volumes e prazos de entrega.

Fonte para desempenho de GPT 3 Nvidia H100: https://mlcommons.org/benchmarks/training/, v3.1, rodada de divisão fechada. Acessado em 30 de abril de 2024

Medições e projeções do Intel Gaudi 3 da Habana Labs, abril de 2024; Os resultados podem variar

As projeções de desempenho do Intel Gaudi 3 não são verificadas pela MLCommons Association. O nome e o logotipo MLPerf são marcas comerciais registradas e não registradas da MLCommons Association nos Estados Unidos e em outros países. Todos os direitos reservados. Uso não autorizado estritamente proibido. Consulte o http://www.mlcommons.org/ para obter mais informações.

Fonte de https://developer.nvidia.com/deep-learning-performance-training-inference/training de desempenho da Nvidia H100 LLAMA2-70B, 29 de abril de 2024, guia "Modelo de grande idioma".

Medições e projeções do Intel Gaudi 3 da Habana Labs, abril de 2024; Os resultados podem variar

Fonte de desempenho da Nvidia: Visão geral — documentação tensorrt_llm (nvidia.github.io), maio de 2024. Os números relatados são de acordo com a GPU.

Projeções do Intel Gaudi 3 da Habana Labs, abril de 2024; Os resultados podem variar

Com base no número total de Tops da plataforma em Lunar Lake versus a geração anterior.