Nova memória ultrarrápida impulsiona os chips do data center da Intel

An illustration of MRDIMMs plugged into a system, highlighting efficient data exchange with a Xeon 6 CPU. Text emphasizes MRDIMMs enhance performance by allowing both memory ranks to access data simultaneously. Intel logo is at the bottom left.

Como a Intel e os parceiros do setor encontraram uma maneira inteligente de dobrar a largura de banda de memória dos módulos DRAM padrão, liberando chips Xeon de alto nível com uma solução plug-and-play.

Embora o foco principal do produto da Intel seja nos processadores, ou cérebros, que fazem os computadores funcionarem, a memória do sistema (que é a DRAM) é um componente fundamental para o desempenho. Isso é especialmente verdadeiro nos servidores, onde a multiplicação de núcleos de processamento superou o aumento da largura de banda da memória (em outras palavras, a largura de banda de memória disponível por núcleo caiu).

Em trabalhos de computação pesado, como modelagem meteorológica, dinâmica de fluidos computacionais e certos tipos de IA, essa incompatibilidade pode criar um gargalo — até agora.

Após vários anos de desenvolvimento com parceiros do setor, os engenheiros da Intel encontraram um caminho para abrir esse gargalo, desenvolvendo uma nova solução que criou a memória de sistema mais rápida já criada e está prestes a se tornar um novo padrão aberto do setor. Os processadores de data center Intel® Xeon® 6 lançados recentemente são os primeiros a beneficiar-se desta nova memória, chamada MRDIMMs, para um maior desempenho — da maneira mais plug-and-play imaginável.

Bhanu Notebook, gerente de produtos Xeon da Intel no grupo de Data Center e IA (DCAI), da Intel, explica que "uma porcentagem significativa das cargas de trabalho de computação de alto desempenho está vinculada à largura de banda da memória", o tipo mais definido para se beneficiar das MRDIMMs.

Parece quase bom demais para ser verdade: aqui está a história por trás do módulo de memória dual inline DDR5 Multiplexed Rank ou MRDIMM para oferecer eficiência em narrativas.

Levando o paralelismo à memória do sistema, com amigos

Parece que os módulos de memória mais comuns usados para trabalhos de data center, conhecidos como RDIMMs, possuem recursos paralelos a bordo, como os processadores modernos. Eles não estão usados assim.

"A maioria dos DIMMs tem duas fileiras para desempenho e capacidade", diz George Vergis, engenheiro chefe sênior em pathfinding de memória no DCAI. "É o ponto ideal."

Você pode pensar em classificações como, bem, bancos — um conjunto de chips de memória em um módulo pertenceria a um e o resto para a outra categoria. Com RDIMMs, os dados podem ser armazenados e acessados em várias fileiras de forma independente, mas não simultaneamente.

Considerando essa situação, lembra Vergis: "Pensamos: 'Espere um minuto. Temos recursos paralelos nãoutilizados. Por que não podemos colocá-los juntos?' A ideia que a Vergis perseguiu foi colocar um chip de interface pequeno - um multiplexador ou "mux" - no módulo DRAM. Ele permite que os dados fluam entre ambas as fileiras de memória na mesma unidade de tempo.

O buffer de mux consolida a carga elétrica de cada MRDIMM, permitindo que a interface opere a uma velocidade mais alta em comparação com os RDIMMs. E agora que ambas as fileiras de memória podem ser acessadas em paralelo, sua largura de banda dobrou.

O resultado é a memória do sistema mais rápida já criada – por um salto que normalmente levaria várias gerações de tecnologias de memória para alcançar (neste caso, a largura de banda máxima sobe quase 40%, de 6.400 megatransfers por segundo (MT/s) para 8.800 MT/s).

Mesmo módulo de memória padrão, apenas mais rápido

Neste momento, você pode ter sua própria pergunta de "espere um minuto": a Intel está voltando ao negócio da memória? Não. Embora a Intel tenha começado como uma empresa de memória e inventado tecnologias, incluindo EPROM e DRAM, a empresa deixou seus vários negócios de produtos de memória ao longo de sua história (alguns muito famosos).

Mas a Intel nunca parou os esforços de "levantar todos os barcos" que tornam diferentes componentes de computação interoperáveis e com maior desempenho. A Vergis representa a Intel na placa de JEDEC, que define padrões abertos para a indústria de microeletrônica, mais notavelmente para a memória. Vergis ganhou um prêmio JEDEC em 2018 por seu trabalho no padrão DDR5, e agora ele está dedicando tempo à DDR6. (A JEDEC também homenageou o CEO da Intel, Pat Gelsinger, este ano , por uma carreira como "um forte defensor dos padrões abertos, como evidenciado pela liderança histórica da Intel no desenvolvimento de padrões")

Vergis e suas coortes iniciaram este trabalho em 2018 e provaram o conceito com protótipos até 2021. Intel se juntou ao ecossistema de memória para construir os primeiros componentese doou as especificações para a JEDEC como um novo padrão aberto no final de 2022.

O que se destaca sobre a MRDIMM é a sua facilidade de uso. Ele emprega o mesmo conector e fator de forma que um RDIMM regular (mesmo os pequenos chips mux se encaixam em pontos anteriormente vazios no módulo), não exigindo alterações na placa-mãe.

As MRDIMMs também oferecem todos os mesmos recursos de correção de erros, confiabilidade, disponibilidade e facilidade de manutenção (RAS) que os RDIMMs. A integridade dos dados é mantida independentemente de como as solicitações separadas podem ser multiplexadas no buffer de dados, explica Vergis.

Tudo isso significa que os clientes de data center podem escolher MRDIMMs quando encomendam um novo servidor ou, posteriormente, podem retirar o servidor do rack e trocar os RDIMMs por novas MRDIMMs. Nem uma única linha de código precisa mudar para desfrutar de um novo desempenho.

Xeon 6 + MRDIMM = 🚀🚀

O que é necessário é uma CPU que possa trabalhar com MRDIMMs, e a primeira disponível é o processador Intel Xeon 6 com Performance-cores, codinome Granite Rapids, que chegou ao mercado este ano.

Testes independentes recentes compararam dois sistemas Xeon 6 idênticos, um com MRDIMMs e o outro com RDIMMs. O sistema com MRDIMMs concluiu trabalhos até 33% mais rápido.

Marksswal diz que a "melhoria na largura de banda que a MRDIMM fornece é muito aplicável a modelos de linguagem pequenas e tipos tradicionais de sistema de aprendizagem profunda e recomendação de cargas de trabalho de IA que podem facilmente ser executadas em Xeon e obter um bom aumento de desempenho com MRDIMM".

Os principais fornecedores de memória introduziram MRDIMMs, com fabricantes de memória adicionais que devem lançar mais. Laboratórios de computação de alto desempenho, como o National Institute for Quantum Science and Technology e o National Institute for Fusion Science, entre outros, estão adotando ativamente o Xeon 6 com P-cores por causa de MRDIMMs, com suporte de OEMs como a NEC.

"A Intel definitivamente tem uma liderança", observa Reimaginswal, "apoiado por um forte ecossistema de OEMs e fornecedores de memória".

 

O desempenho varia conforme o uso, a configuração e outros fatores. Saiba mais em www.Intel.com/PerformanceIndex.