[디지털데일리 김문기 기자] “MI355는 가격 대비 성능에서 2~3배의 이점을 제공하며, OCI에서 단일 클러스터로 최대 13만 GPU까지 확장 가능한 구조를 구현할 수 있다.”
마헤쉬 티아가라얀(Mahesh Thiagarajan) 오라클 클라우드 인프라스트럭처(OCI) 총괄 부사장(Executive VP)은 12일(현지시간) 미국 새너제이 컨벤션 센터에서 개최된 '어드밴싱 AI 2025(Advancing AI 2025, AAAI 2025)’에서 AMD와 손잡고 단일 클러스터 규모 최대 13만 개 GPU를 연결하는 ‘제타-스케일 AI(Zeta-scale AI) 인프라’ 구축에 나선다며 이같이 말했다.
티아가라얀 부사장은 “오라클은 다양한 리전과 워크로드에 맞춰 유연한 인프라를 제공해왔다”고 언급했다.
또한 오라클은 AI 클러스터가 커질수록 GPU 자체보다 이들을 연결하는 네트워크의 중요성이 커진다는 점 또한 강조했다. AMD 차세대 페산도 폴라라(Polara)가 갖춘 프로그래머빌리티, 유연성, 고성능 RDMA 통신을 핵심 요인으로 꼽기도 했다.
폴라라(Polara)는 UEC(Ultra Ethernet Consortium) 기반의 오픈 네트워크 표준을 지원해, 특정 벤더에 종속되지 않고 클라우드 고객에게 더 많은 선택권을 제공할 수 있다는 장점이 있다.
그는 “초대형 AI를 위한 네트워크는 단순히 빠른 게 아니라, 열리고 맞춤형으로 설계 가능한 구조여야 한다”고 강조했다.
아울러, 오라클은 AI 클러스터 운영에 있어 프론트엔드 네트워크 성능의 중요성도 짚었다. 데이터를 GPU 클러스터로 안정적이고 빠르게 공급하는 것이 전체 추론·학습 효율에 직결되기 때문이다.
티아가라얀 부사장은 “DPU는 이제 단순 가속기가 아니라, AI와 엔터프라이즈를 연결하는 안전한 관문 역할을 한다”고 설명했다.
- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -




























































