Inflection AI e Intel lançam sistema de IA para empresas

The image features the text Inflection AI + intel above a series of dynamic, green, wavy lines on a light background.

Inflection AI and Intel

Inflection for Enterprise, impulsionado por Gaudi e Intel Tiber AI Cloud, ajuda empresas a enfrentar cargas de trabalho críticas com IA

Quais as novas: Hoje, a Inflection AI e a Intel anunciaram uma colaboração para acelerar a adoção e o impacto da IA para empresas, bem como para desenvolvedores. A Inflection AI está lançando a Inflection for Enterprise, um sistema de IA de nível empresarial, fabricado pela Intel® Gaudi® e a Intel® Tiber™ AI Cloud (nuvem de IA), para fornecer recursos de IA em empatia, conversadores e amigáveis para os funcionários e fornecer o controle, a personalização e a escalabilidade necessários para implantações complexas e em larga escala. Este sistema está disponível atualmente através da AI Cloud e será enviado aos clientes como um dispositivo de IA primeiro do setor com a Gaudi 3 no 1º trimestre de 2025.

"Por meio desta colaboração estratégica com a Inflection AI, estamos estabelecendo um novo padrão com soluções de IA que oferecem resultados imediatos e de alto impacto." Com suporte para modelos de código aberto, ferramentas e desempenho competitivo por watt, as soluções Intel Gaudi 3 tornam a implantação de IA Generativa acessível, econômica e eficiente para empresas de qualquer tamanho.

— Justin Hotard, vice-presidente executivo e gerente geral da Intel para data center e grupo de IA

Por que importa: A construção de um sistema de IA normalmente exige uma infraestrutura substancial — desenvolvimento e treinamento de modelo abrangentes e colaboração entre engenheiros, cientistas de dados e desenvolvedores de aplicativos. Com a Inflection for Enterprise, desenvolvida com Inflection 3.0, os clientes empresariais agora podem aproveitar uma solução de IA abrangente que capacita sua força de trabalho com um colega de trabalho de IA virtual treinado especificamente em seus dados, políticas e cultura de empresa exclusivos. A parceria com a Intel proporciona desempenho incomparável por meio do acelerador de IA Intel Gaudi 3, que oferece preço/desempenho líder do setor para resultados de impacto eficientes. A tecnologia da Intel garante flexibilidade e escalabilidade para resultados de alto impacto. Além disso, a AI Cloud simplifica a construção, teste e implantação de aplicativos de IA em um ambiente unificado, acelerando o tempo de lançamento no mercado. Com o valor e os benefícios que este serviço oferece, a Intel e a Inflection AI também estão colaborando para implantar a Inflection for Enterprise dentro da Intel, com a antecipação de que a Intel será um cliente inicial da solução.

"Cada CEO e CTO com quem falamos está frustrado por as ferramentas de IA existentes no mercado não serem realmente de nível empresarial", disse Ted Shelton, COO da Inflection AI. "As organizações empresariais precisam de mais do que IA genérica estando às prateleiras, mas não têm experiência para ajustar um modelo eles mesmos. Temos orgulho de oferecer um sistema de IA que resolve esses problemas e, com os ganhos de desempenho que vemos em execução na Intel Gaudi, sabemos que ele pode ser dimensionado para atender às necessidades de qualquer empresa".

Como funciona: A Inflection AI ajusta sua modelagem para ser nativa de cada organização, agilizando a adoção do usuário e melhorando a utilidade dos casos de uso por meio de alinhamento com o tom, propósito e informações operacionais exclusivas de produtos, serviços e operações da empresa. Inflection 3.0 oferece aos clientes empresariais um tempo mais rápido para gerar valor, por meio de experiências de IA generativa amigáveis para os funcionários, ao mesmo tempo em que proporciona vantagens em termos de preço, desempenho e segurança/compliance.

  • Removendo barreiras para a GenAI — Desenvolvido com base na AI Cloud, a Inflection for Enterprise oferece modelos de aplicações projetados para permitir que as empresas pulem testes e modelos de hardware e evitem as despesas de capital para escalar rapidamente. No 1º trimestre de 2025, os clientes também terão a opção de comprar a Inflection for Enterprise em um dispositivo de IA pronto para uso completo. Aproveitando a Gaudi 3, os clientes deste dispositivo podem se beneficiar de um desempenho de preço até 2x melhor, bem como de 128 GB de capacidade de memória de alta largura de banda otimizando ainda mais seu desempenho de GenAI em comparação com as ofertas concorrentes atuais.
  • Preço/desempenho otimizados –  Enquanto o aplicativo Pi da Inflection AI para consumidores era anteriormente executado em GPUs da Nvidia, o Inflection 3.0 será alimentado por Gaudi 3, com instâncias locais ou na nuvem suportadas pela AI Cloud. Isso não só reduz o tempo de implantação, mas também o custo total de propriedade.
  • Ajustado para empresas — Aproveitando o ajuste fino e o aprendizado por reforço com a experiência de feedback humano (RLHF) que impulsionou o Pi da Inflection AI, a inflexão para modelos empresariais é exclusivo para cada empresa e maneira de operar. Modelada em dados e insights do histórico, políticas, conteúdo, tom, produtos e informações operacionais de uma empresa, a IA frágil ajuda a impulsionar a produtividade e o alinhamento em uma organização.
  • Propriedade e segurança aprimoradas – Inflection for Enterprise permite que as empresas possuam sua inteligência em sua totalidade. Modelos ajustados são os únicos do cliente e nunca são compartilhados fora de sua organização. Além disso, os clientes podem hospedar e executar o modelo em sua arquitetura preferida, seja hospedado no local, na nuvem ou híbrido.

O que vem a seguir: Olhando adiante, a Inflection AI e a Intel também permitirão que os desenvolvedores criem aplicações empresariais para a inflexão para empresas, aproveitando o sistema Inflection 3.0 robusto e centrado em seres humanos, para gerar ferramentas críticas de software. Clientes corporativos interessados na Inflection for Enterprise, acesse https://inflection.ai/intel para saber mais ou inscrever-se para uma demonstração.

Fonte: resultados medidos pela Intel comparados às fontes de dados H100: https://github.com/NVIDIA/TensorRT-LLM/blob/main/docs/source/performance/perf-overview.md entrada-saída
Sequências: 128-2048tps em 2 aceleradores/GPUs. Os resultados da Intel obtidos em 9 de setembro de 2024.
Hardware: dois aceleradores de IA Intel Gaudi 3 (HBM de 128 GB) em comparação com duas GPUS Nvidia H100 (HBM de 80 GB).
Software: software Intel Gaudi versão 1.18.0.
Consulte o link Nvidia para obter os detalhes do software H100.
Os resultados podem variar.
Estimativas de preços baseadas em informações disponíveis ao público e análise interna da Intel