인공지능(AI) 분야 혁신을 도모하기 위해 연구에 몰두하고 있는 LG AI연구원이 역사적인 일을 해냈다. LG AI연구원의 성공보다 AI 연구 생태계 발전이 더 중요하다는 판단에서 나온 결정으로 풀이된다.
지난 7일 LG AI연구원은 최신 AI 모델 '엑사원(EXAONE) 3.0'을 오픈소스로 공개했다.
LG AI연구원은 AI 연구 생태계 발전에 기여하기 위해 '엑사원 3.0' 모델 중 성능과 경제성에 있어 가장 활용도가 높은 '경량 모델'을 연구 목적으로 활용하도록 오픈소스 공개를 결정했다.
임직원을 대상으로 '엑사원 3.0'을 기반으로 만든 생성형 AI 서비스인 '챗엑사원 (ChatEXAONE)' 베타 버전도 공개했다.
이와 함께 LG AI연구원은 이날 '엑사원 3.0'의 모델 학습 방법, 성능 평가 결과 등을 담은 기술 보고서를 발표했다.
LG AI연구원은 2021년 12월 거대언어모델(LLM) '엑사원 1.0' 발표 이후 2023년 7월 '엑사원 2.0'을 공개하는 등 3년간 생성형 AI를 실제 산업 현장에 접목시키기 위해 부단히 노력해왔다.
엑사원 3.0은 기존 버전에서 굉장한 혁신을 거둔 것으로 평가된다. 성능과 경제성을 모두 잡았다는 평가다. 이전 모델인 '엑사원 2.0' 대비 추론 처리 시간은 56%, 메모리 사용량은 35% 줄이고 구동 비용은 72% 절감하는 등 성능과 경제성에서 모두 뛰어났다.
LG AI연구원은 AI로 인해 불거지는 소비 전력 문제를 해결하기 위해 경량화·최적화 기술 연구에 집중했는데, 큰 성과를 거뒀다. 초기 거대 모델 대비 성능은 높이면서도 모델 크기는 100분의 3으로 줄였다.
엑사원 3.0은 실제 사용성을 비롯해 코딩과 수학 영역 등 13개 벤치마크 점수 순위에서 1위를 차지했다. 메타(Meta)의 라마(Llama)3.1, 구글(Google)의 젬마(Gemma)2 등 동일 크기 글로벌 오픈소스 AI 모델과의 비교에서도 글로벌 경쟁력을 입증했다.
엑사원 3.0 한국어 성능도 세계 최고 수준...데이터 6천만건 이상 학습
한국어와 영어를 학습하고 이해할 수 있는 이중언어 모델인 '엑사원 3.0'은 한국어 성능도 세계 최고 수준이었다. 특허와 소프트웨어 코드, 수학, 화학 등 국내외 전문 분야 데이터 6천만건 이상을 학습했다.
LG AI연구원은 연말까지 의료, 교육, 외국어, 법률, 바이오 등 분야를 확장해 학습 데이터 양을 1억건 이상으로 늘린다는 계획이다. 이를 통해 '엑사원 3,0'의 성능을 더 끌어올린다는 목표다.
성장한 엑사원 3.0은 LG 계열사들의 제품과 서비스에도 접목시킬 것으로 알려졌다.
LG AI연구원은 온디바이스 AI에 들어갈 '초경량 모델'부터 범용 목적의 '경량 모델', 특화 분야에 활용할 수 있는 '고성능 모델'까지 활용 용도에 따라 모델 크기를 다르게 설계했다.
LG 계열사들은 각 사가 보유한 데이터로 '엑사원 3.0'을 최적화하고 사업과 제품, 서비스 특성에 맞게 이를 적용해 혁신 속도를 높여갈 계획이다.
구광모 LG그룹 회장이 AI를 미래 사업으로 점찍은 만큼 사업화에도 속도를 낼 방침이다.
한편 구광모 회장은 지난해 LG 주주총회에서 'ABC 사업 전략'을 강조했다. 구 회장은 "인공지능(AI), 바이오, 클린테크 등 새로운 성장축을 중심으로 사업 포트폴리오를 강화해 10년, 15년 뒤를 대비한 미래 기반 확보에 더욱 힘쓰겠다"라고 강조했다.
2020년 그룹 차원의 AI 전담 조직인 'LG AI연구원'을 설립하며 미래 사업을 위한 기반을 다진 구 회장은 당분간 통 큰 투자를 이어가며 AI 사업을 키워나간다는 전략이다.