인텔 가우디 3, 델 AI 플랫폼에 탑재로 대규모 AI 혁신을 위한 가용성 확대

May 19, 2025 발행

a gaudi 3 accelerator sits over a blue background

Available through Dell AI Factory, Intel Gaudi 3 AI accelerators deliver high performance, open source flexibility and enterprise-grade infrastructure to speed AI adoption. (Credit: Intel Corporation)

델 AI 팩토리를 통해 제공되는 인텔 가우디 3 AI 가속기, 고성능, 오픈 소스 유연성 및 엔터프라이즈급 인프라를 제공하여 AI 도입 속도 향상

아티클 내용에서:

2025년 5월 21일 서울 – 인텔은 델(Dell)이 델 AI 팩토리(Dell AI Factory) 최신 포트폴리오에 인텔® 가우디® 3(Intel® Gaudi® 3) AI 가속기를 탑재한 인텔 기반 델 AI 플랫폼(Dell AI platform with Intel)을 공개했다고 밝혔다. 완벽하게 검증된 엔드 투 엔드 솔루션인 이번 플랫폼은 기업이 AI 기술을 손쉽게 도입·통합·확장할 수 있도록 설계되었으며, 인텔 가우디 3 하드웨어와 오픈 소스 소프트웨어의 스택 및 델의 신뢰할 수 있는 인프라 전문성을 결합해 다양한 산업 전반에서 AI 전환을 가속화할 수 있는 원활한 경로를 제공한다.

사우라브 쿨카니(Saurabh Kulkarni) 인텔 데이터센터 AI 전략 및 제품 담당은 “델과의 협력을 통해 인텔 가우디 3의 강력한 성능을 엔터프라이즈 배포에 즉시 사용할 수 있는 통합 솔루션으로 제공하게 되었다. 이 플랫폼은 대규모 언어 모델(LLM)부터 엣지 추론에 이르기까지 최신 AI의 요구 사항을 충족하도록 최적화되었으며, 기업이 필요로 하는 유연성과 개방성을 제공한다”고 밝혔다.

기업은 AI 도입 과정에서 고성능·확장성·유연성·비용효율성 등을 종합적으로 고려해야 한다. 인텔 기반 델 AI 플랫폼에 탑재된 인텔 가우디 3는 생성형 AI 워크로드에서 경쟁력 있는 가격 대비 우수한 성능이 강점으로, 실제로 엔비디아 H100 보다 Llama 3 80B 모델 추론 처리량에서 70%¹ 가량 우수한 가격대 성능비를 보여준다. 인텔 기반 델 AI 플랫폼의 확장형 아키텍처는 비즈니스의 성장과 함께 유연하게 확장 가능하며, 개방형 네트워킹 및 소프트웨어 스택을 제공해 특정 벤더 종속을 방지한다. 이를 통해 개발자, IT팀, 비즈니스 리더는 모든 여정의 단계에서 AI 가치를 극대화할 수 있다.

이에 바룬 차브라(Varun Chhabra) 델 테크놀로지 부사장은 “오늘날 기업은 단순한 컴퓨팅 성능을 넘어, AI 여정을 가속화할 확장 가능하고, 개방적이며 효율적인 솔루션을 필요로 한다”고 밝혔다. 또한 “인텔 기반 델 AI 플랫폼은 미래에도 대응이 가능한 AI 혁신을 제공함으로써 고객의 필요와 함께 성장할 수 있는 기반을 제공한다”고 강조했다.

AI 워크로드를 위한 맞춤형 설계

인텔 기반 델 AI 플랫폼의 중심에는 AI 워크로드에 최적화된 고성능 서버인 파워엣지 XE9680(PowerEdge XE9680)가 있으며, 주요 특징은 다음과 같다:

8개의 인텔 가우디 3 가속기: 대규모 언어 모델(LLM) 및 컴퓨터 비전 작업에 적합한 128GB 고대역폭메모리(HBM) 및7TB/s 대역폭을 탑재한 8개의 인텔 가우디 3 가속기
5세대 인텔® 제온® (5th Gen Intel® Xeon®) 프로세서: 복잡한 연산을 원활히 처리할 수 있도록 최대 64코어 및 PCIe Gen 5 슬롯을 탑재한 5세대 인텔 제온 프로세서
확장 가능한 스토리지 및 네트워킹: 원활한 데이터 흐름과 스토리지 및 연결 병목 현상 방지를 위한 32개의 DIMM 슬롯, 16개의 드라이브 지원, 800GbE 기반의 확장 가능한 스토리지 및 네트워킹
에너지 효율적인 공랭식 시스템: 생성형 AI 및 머신러닝 등 대규모 AI 워크로드를 지원하도록 최적화된 에너지 효율적인 공랭식 시스템

개발자 최적화 방안

사전 검증된 오픈소스 소프트웨어 스택이 포함된 이 플랫폼은 다음과 같은 기능을 지원한다:

손쉬운 모델 미세 조정을 위한 파이토치(PyTorch) 및 허깅 페이스(Hugging Face)와 같은 프레임워크
유연한 리소스 스케줄링 및 오케스트레이션 제공을 위한 쿠버네티스(Kubernetes)
실시간 옵저버빌리티 및 모니터링을 위한 그라파나(Grafana) 및 프로메테우스(Prometheus)

또한, 델 엔터프라이즈 허브(Dell Enterprise Hub)는 인텔 가우디 3에 최적화된 모델 카탈로그를 제공해 개발자가 신속하게 구현할 수 있도록 지원한다.

간소화된 클러스터 관리

고성능 클러스터를 구축하고 관리할 수 있도록 지원하는 오픈소스 툴킷인 ‘델 옴니아(Dell Omnia)’는 인텔 기반 델 AI 플랫폼에서 핵심적인 역할을 수행한다. 해당 툴킷은 유연한 리소스 할당을 통해 IT 팀 및 개발자가 변화하는 워크로드에 빠르게 대응하고 최적화할 수 있도록 지원하고, 이를 통해 구축 시간 단축 및 전반적인 생산성 향상을 이끌어낸다. 또한 다양한 툴 및 프레임워크와의 매끄러운 통합을 통해, 인텔 기반 델 AI 플랫폼은 엔터프라이즈급 신뢰성과 개발자 민첩성이 조화를 이루는 최적의 환경을 제공한다.

향후 계획: 인텔 가우디 3 AI 가속기의 성능을 직접 경험할 수 있도록, 5월 19일부터 22일까지 라스베이거스에서 열리는 델 테크놀로지스 월드 2025(Dell Technologies World 2025)에서 인텔(#654)와 델 부스(#833)에서 인텔 기반 델 AI 플랫폼을 만나볼 수 있다.

참고 사항:

1 출처: 인텔이 측정한 결과와 엔비디아 H100 데이터 소스 (http://github.com/NVIDIA/TensorRT-LLM/blob/main/docs/source/performance/perf-overview.md)를 비교한 자료로, 128~2048 입력-출력 시퀀스에 대한 인텔 결과는 2024년 9월 9일에 확보되었다. 결과는 변동될 수 있다. 가격 추정치는 공개된 정보와 인텔 내부 분석을 기반으로 산출되었다.

인텔은 제3자 데이터에 대해 제어하거나 감사하지 않으며, 정확성 평가를 위해서는 다른 출처도 함께 참고할 것을 권장합니다.