NHN클라우드는 크래프톤의 'GPU 클러스터 사업' 최종 사업자로 선정돼 계약을 체결하고, 서비스형 GPU(GPUaaS) 기반 인프라를 제공한다고 19일 밝혔다.
이번 사업은 크래프톤이 지난해 10월 'AI 퍼스트'를 경영 핵심 전략으로 선언한 이후, AI 활용 확대에 따라 증가하는 연산 수요에 대응하기 위해 추진됐다. GPU 클러스터는 AI 플랫폼 고도화와 데이터 통합·자동화 등 중장기 AI 전략을 안정적으로 추진하기 위한 기반으로, GPUaaS를 통해 인프라를 확장하고 운영 효율을 높이는 데 초점을 맞췄다.
NHN클라우드는 대규모 GPU 클러스터를 제공해 크래프톤의 AI 전략 실행을 지원한다. 광주 국가 AI 센터를 설계·구축하고 2021년부터 GPUaaS 서비스를 운영해 온 경험과, 공공·민간을 대상으로 한 AI 인프라 운영 사례가 이번 사업 수행의 배경으로 꼽힌다. 고객 요구에 맞춰 시스템을 설계·구축해 온 사업 수행 역량도 고려 요소로 작용했다.
이번 사업에서는 엔비디아의 최신 GPU인 '블랙웰 울트라' 약 1000장으로 구성된 GPU 팜을 멀티 클러스터 구조로 구축한다. 여기에 XDR-800G급 초고속 인피니밴드 네트워크를 적용해 GPU 간 대용량 데이터를 저지연·고속으로 전송할 수 있도록 설계한다. 이를 통해 다수의 GPU를 동시에 활용하는 환경에서도 데이터 병목을 줄이고, AI 모델 학습과 추론 작업을 안정적으로 운영할 수 있도록 할 계획이다.
또한 GPU 자원을 여러 작업이 함께 사용할 수 있도록 동적 관리 구조를 적용한다. AI 개발, 학습, 추론 등 다양한 작업이 동시에 진행되는 환경에서 GPU 자원을 필요에 따라 배분·조정해 유휴 자원을 최소화하고 클러스터 활용 효율을 높인다는 구상이다. 이 방식은 소규모 AI 개발부터 대규모 LLM 학습까지 작업 규모와 특성에 맞춰 적용될 수 있다.
NHN클라우드는 쿠버네티스와 HPC 환경에 적합한 슬럼(Slurm) 기반 자원 관리 솔루션을 적용한 맞춤형 GPUaaS도 제공한다. 이를 통해 대규모 연산 환경에서도 안정적인 운영을 지원하고, 다양한 AI 개발 도구와 외부 시스템 연동을 통해 개발 및 운영 효율을 높일 계획이다.
해당 GPU 인프라는 NHN클라우드 판교 NCC에 구축된다. 판교 NCC는 고집적 연산에 필요한 전력·냉각 인프라와 네트워크 환경을 갖춘 시설로, 대규모 AI 워크로드 처리에 적합하다. 인프라는 오는 7월 구축을 완료하고 본격 가동될 예정이다.
크래프톤 관계자는 "AI 퍼스트 전략 추진 과정에서 GPU 클러스터는 전사 AI 운영의 핵심 기반"이라며 "GPUaaS를 통해 AI 연구와 서비스 전반의 확장성과 효율성을 높일 수 있을 것으로 기대한다"고 말했다.
NHN클라우드 관계자는 "이번 사업을 통해 대규모 GPU 클러스터를 GPUaaS 형태로 구축·운영하게 됐다"며 "7월 가동 이후 안정적인 클러스터 운영과 기술 지원에 집중할 계획"이라고 밝혔다.































































