LG AI연구원, 독자 기술 집약한 ‘K-엑사원’ 공개

'K-엑사원' 모델 구조. LG 제공

 

LG AI연구원이 11일 세계 최고 수준의 AI 모델인 ‘K-엑사원(EXAONE)’을 공개했다. K-엑사원은 LG AI연구원이 지난 5년간 AI 파운데이션 모델을 직접 개발하며 쌓아온 기술력을 집약해 만든 모델이다.

 

K-엑사원은 독자 AI 파운데이션 모델 프로젝트 1차 평가 기준인 13개의 벤치마크 테스트 중 10개에서 1위를 차지했으며, 전체 평균 점수도 72점을 기록해 5개 정예팀이 개발한 모델 중에서 가장 뛰어난 성능을 보였다.

 

글로벌 AI 성능 평가 기관인 아티피셜 어낼리시스의 인텔리전스 지수 평가에선 32점을 기록해 가중치를 공개하는 오픈 웨이트 모델 기준 세계 7위, 국내 1위에 올랐다.

 

이진식 LG AI연구원 엑사원랩장은 “주어진 시간과 인프라 상황에 맞게 개발 계획을 수립했고, 보유하고 있는 데이터의 절반 정도만 사용해 1차수 K-엑사원을 만들었다"며 “1차수는 프런티어 모델로 도약하기 위한 시작점이며, 앞으로 본격적으로 성능을 끌어올린 K-엑사원을 선보이겠다”고 강조했다.

 

K-엑사원은 글로벌 오픈소스 AI 플랫폼인 허깅 페이스에 오픈 웨이트로 공개한 직후 글로벌 모델 트렌드 순위 2위에 오르기도 하는 등 전 세계 연구자들의 높은 관심을 받고 있다. 단순히 데이터 양만 늘리는 방식이 아닌 성능은 높이고, 학습 및 운용 비용은 낮추는 고효율 저비용으로 모델의 구조 자체를 혁신했다는 게 LG AI연구원의 설명이다. 

 

LG AI연구원은 엑사원 4.0에서 검증된 핵심 기술인 ‘하이브리드 어텐션’을 고도화해 K-엑사원에 적용했다. 어텐션은 AI 모델이 방대한 양의 데이터를 처리할 때 어떤 정보에 집중해야 하는지 판단하는 두뇌와 같은 역할을 한다.

 

LG AI연구원은 AI의 언어 능력 향상에 중요한 역할을 하는 토크나이저도 고도화했다. 토크나이저는 AI가 이해하는 단위인 토큰으로 문장을 쪼개는 기술이다. LG AI연구원은 학습 어휘를 15만 개로 확장하고, 자주 쓰는 단어 조합은 하나로 묶는 방식을 적용하는 등 토크나이저 고도화로 ‘K-엑사원’이 기존 모델 대비 1.3배 더 긴 문서를 기억하고 처리할 수 있게 했다.

 

최정규 LG AI연구원 에이전틱 AI 그룹장은 “K-엑사원은 자원의 한계 속에서 독자적인 기술 설계로 글로벌 거대 모델들과 대등하게 경쟁할 수 있음을 보여준 사례”라면서 “대한민국 대표 AI를 개발한다는 자신감으로 연구 개발에 집중해 우리나라 AI 생태계를 넘어 전 세계 AI 생태계 발전에 기여하는 모델을 만들어 가겠다”고 말했다.

 

오현승 기자 hsoh@segye.com

[ⓒ 세계비즈앤스포츠월드 & segyebiz.com, 무단전재 및 재배포 금지]