팀네이버가 차세대 그래픽처리장치(GPU)를 기반으로 국내 최대 규모의 인공지능(AI) 컴퓨팅 클러스터 구축을 완료했다고 8일 밝혔다. 글로벌 빅테크 엔비디아의 차세대 GPU ‘B200(블랙웰)’ 4000장이 바탕됐다.
이번에 구축된 B200 4K 클러스터는 네이버의 냉각∙전력∙네트워크 최적화 기술이 집약됐다. 대규모 병렬 연산과 고속 통신을 전제로 설계됐으며, 글로벌 톱 500 슈퍼컴퓨터들과 비교 가능한 수준의 컴퓨팅 규모를 갖췄다.
인프라 성능은 AI 모델 개발 속도와 직결된다. 네이버 측은 “내부 시뮬레이션 결과 720억 개(72B) 파라미터 규모 모델 학습 시 기존 A100 기반 주력 인프라(2048장)로 약 18개월이 소요됐지만 B200 4K 클러스터에서는 약 1.5개월 수준으로 단축할 수 있는 효과가 확인됐다”고 설명했다.
이어 “학습 효율이 12배 이상 향상됨에 따라 더 많은 실험과 반복 학습을 통해 모델의 완성도를 높이고 변화하는 기술 환경에 보다 기민하게 대응할 수 있는 개발∙운영 체계를 갖추게 됐다”고 덧붙였다.
팀네이버는 이러한 인프라를 바탕으로 현재 진행 중인 독자 파운데이션 모델 고도화에도 속도를 낼 계획이다. 텍스트를 넘어 이미지∙비디오∙음성을 동시에 처리하는 옴니(Omni) 모델 학습을 대규모로 확장해 성능을 글로벌 수준으로 끌어올리고 이를 다양한 서비스와 산업 현장에 단계적으로 적용한다는 구상이다.
최수연 네이버 대표는 “이번 AI 인프라 구축은 단순한 기술 투자를 넘어 국가 차원의 AI 경쟁력 기반과 AI 자립∙주권을 뒷받침하는 핵심 자산을 확보했다는데 의미가 있다”며 “빠른 학습과 반복 실험이 가능한 인프라를 바탕으로 AI 기술을 서비스와 산업 현장에 보다 유연하게 적용해 실질적인 가치를 만들 것”이라고 말했다.
박재림 기자 jamie@segye.com