엑사원 3.0, 이전 모델 대비 성능 56%↑·비용 72%↓
메타 라마3.1·구글 젬마2 등보다 글로벌 경쟁 우위 갖춰
LG, 엑사원 오픈소스로 공개…“AI 연구 생태계 활성화”
생성형 AI ‘챗엑사원’도 선봬…‘AI의 일상화 시대’ 대응
구광모 LG그룹 회장이 2018년 회장직에 오른 이후 지난 6년여 간 ‘선택’과 ‘집중’을 통해 위기 사업을 과감히 정리하고, 인공지능(AI), 배터리 등 신사업에 공격적인 투자를 단행하면서 LG의 양적, 질적 성장을 이끌고 있다. 이같은 성과를 발판 삼아 구 회장은 신사업을 기반으로 한 미래 경영에 더욱 속도를 올리고 있다.
구 회장이 미래 먹거리로 낙점한 신사업 중 단연 주목받는 분야는 AI다. LG는 AI 기술이 다양한 산업 분야의 난제를 푸는 해결사 역할을 해낼 것으로 보고, AI 사업 육성에 박차를 가하고 있다.
구 회장의 차세대 AI 개발 노력이 마침내 빛을 발하는 모습이다. LG AI연구원이 2021년 12월 초거대 AI을 선보인 지 2년 8개월여 만에 한층 진화한 ‘엑사원(EXAONE) 3.0’을 전격 공개했다.
LG AI연구원은 AI 연구 생태계 발전에 기여하기 위해 엑사원 3.0 모델 중 성능과 경제성에 있어 가장 활용도가 높은 ‘경량 모델’을 연구 목적으로 활용할 수 있도록 오픈소스로 공개하기로 결정했다. 또 임직원을 대상으로 엑사원 3.0 기반의 생성형 AI 서비스 ‘챗엑사원(ChatEXAONE)’ 베타 버전을 선보이며 ‘AI의 일상화 시대’로의 전환을 가속화하고 있다.
LG AI연구원은 최신 AI 모델 엑사원 3.0과 엑사원 모델 학습 방법 및 성능 평가 결과 등을 담은 기술 보고서(Technical Report)를 7일 발표했다.
LG가 이번에 공개한 엑사원 3.0은 성능과 경제성을 모두 잡았다. 최신 엑사원은 이전 모델보다 성능은 56% 높이고, 비용은 72% 절감한 것이 특징이다.
LG AI연구원은 AI로 인해 촉발된 소비 전력 문제를 해결하기 위해 경량화·최적화 기술 연구에 집중해 초기 거대 모델 대비 성능은 높이면서도 모델 크기는 100분의 3으로 줄이는데 성공했다.
엑사원 3.0 기술 보고서에는 △MT-Bench △AlpacaEval-2.0 △Arena-Hard △WildBench 등 AI 모델의 대화 성능 등 실제 사용성을 종합적으로 평가하는 대표적인 벤치마크(성능 평가 지표)와 함께, 평가에 활용한 25개 벤치마크의 개별 점수와 각 영역별 평균 점수가 모두 담겼다. 특히 신뢰성을 한층 배가했다.
실제로 엑사원은 사용성을 비롯해 코딩과 수학 영역 등 13개 벤치마크 점수 순위에서 1위를 차지한 것으로 나타났다. 이에 메타의 라마(Llama)3.1, 구글의 젬마(Gemma)2 등 동일 크기의 글로벌 오픈소스 AI 모델과의 비교에서도 경쟁 우위를 갖춘 것으로 나타났다.
한국어와 영어를 학습하고 이해할 수 있는 이중 언어(Bilingual) 모델인 엑사원 3.0은 한국어 성능도 세계 최고를 기록했다.
아울러 최신 엑사원은 특허와 소프트웨어 코드, 수학, 화학 등 국내외 전문 분야 데이터도 6000만건 이상을 학습했다. LG AI연구원은 올해 연말까지 법률, 바이오, 의료, 교육, 외국어 등으로 분야를 확장해 학습 데이터 양을 1억건 이상으로 늘려 엑사원 3,0의 성능을 더욱 끌어올린다는 구상이다.
엑사원의 안전성과 신뢰성을 높이는 데에도 공을 들였다. LG AI연구원은 AI 모델에 의도적으로 공격을 시도해 기술과 서비스 취약점을 검증하고, 이를 보완하고 개선하는 레드티밍(Red-teaming)을 수행했다.
이렇듯 높은 완성도를 자랑하는 엑사원 3.0은 오픈소스로 공개돼 눈길을 끌었다.
배경훈 LG AI연구원장은 “국내 처음으로 자체 개발한 AI 모델 엑사원 3.0을 오픈소스로 공개해 학계, 연구기관, 스타트업 등이 최신 생성형 AI 기술을 활용할 수 있게 했다”며 “개방형 AI 연구 생태계 활성화와 더불어 국가 AI 경쟁력을 높이는 데 기여하고자 한다”고 강조했다. 이어 “엑사원을 오픈소스로 공개하는 것에 대해 기술적·사업적 이점을 포기하는 것이 아니냐는 우려도 있었으나 AI 기술이 빠르게 발전하는 상황에서 지금의 모델을 공개하는 것이 AI 생태계에 긍정적인 영향을 줄 수 있다고 판단했다”고 덧붙였다.
LG는 올 하반기부터 엑사원 3.0이 들어간 LG 제품과 서비스를 출시할 예정이다.
LG AI연구원은 온디바이스(On device) AI에 들어갈 ‘초경량 모델’부터 범용 목적의 ‘경량 모델’, 특화 분야에 활용할 수 있는 ‘고성능 모델’까지 활용 용도에 따라 모델 크기를 다르게 설계했다.
LG 계열사들은 각 사가 보유한 데이터로 엑사원 3.0을 최적화하고, 사업과 제품, 서비스 특성에 맞게 이를 적용해 나가기로 했다.
글로벌 파트너십도 적극 논의한다. 배 원장은 “실제 산업 현장에서 활용할 수 있는 AI를 만드는 것이 중요한 만큼 특화된 성능과 경제성을 갖춘 엑사원으로 LG 계열사와 외부 기업·기관과의 파트너십을 강화해 나가겠다”고 말했다.
또한 LG는 임직원을 대상으로 챗엑사원 베타 서비스를 시작한다. 챗엑사원은 엑사원 3.0을 기반으로 만든 생성형 AI 서비스로 △실시간 웹 정보 기반 질의 응답 △문서, 이미지 기반 질의 응답 △코딩 △데이터베이스 관리 등 업무 편의성과 효율성을 높일 수 있는 다양한 기능을 갖췄다.
실시간 웹 검색 결과를 활용하는 ‘검색 증강 생성(RAG)’ 기술도 적용됐다. 이에 임직원이 입력한 지시문(프롬프트)의 맥락을 파악한 뒤 최신 정보를 반영한 답변을 제공한다.
이를 통해 LG 임직원은 검색부터 요약, 번역, 데이터 분석, 보고서 작성, 코딩까지 AI를 다양한 업무에 활용하며 일하는 방식의 변화를 경험하게 될 것으로 기대를 모은다.
소프트웨어 개발자와 데이터 분석 전문가를 위한 기능도 제공한다. LG AI연구원은 챗엑사원이 자연어 입력만으로 파이썬, 자바, C++ 등 22개 프로그래밍 언어와 데이터베이스 관리에 활용할 수 있는 SQL(구조화된 질의 언어) 쿼리까지 생성할 수 있어 임직원의 업무 효율성을 높일 수 있을 것으로 봤다.
LG는 연말까지 베타 서비스를 진행하며 임직원들의 의견과 아이디어를 반영한 업데이트를 주기적으로 시행키로 했다. 정식 서비스와 모바일 앱은 LG 계열사별 준비 상황에 맞춰 순차적으로 제공할 예정이다.
LG AI연구원 관계자는 “생성형 AI는 입력하는 지시문 즉, 질문을 어떻게 하는지에 따라 다른 결과물을 생성한다”며 “관심 직무와 업무 특성에 맞는 질문, AI가 답변한 결과에 이어서 입력할 수 있는 질문 등을 추천해주는 기능도 개발·적용함으로써 생성형 AI 이용에 익숙하지 않은 임직원들도 편하게 활용할 수 있을 것이다”고 말했다.
구 회장은 취임 이후 미래 사업으로 AI를 점찍고 과감한 투자와 혁신을 강조해 왔다. LG는 2020년 12월 그룹 AI 연구의 싱크탱크인 LG AI연구원을 설립한 후, 지난 4년 간 AI 전환 가속화를 추진해 왔다. 이후 생산 공정, 소재·제품 개발, 고객 서비스 개선 등 각 계열사 사업 현장에 AI 기술 적용 사례를 늘려가고 있다.
[CEO스코어데일리 / 오창영 기자 / dongl@ceoscore.co.kr]
댓글
[ 300자 이내 / 현재: 0자 ]
현재 총 0개의 댓글이 있습니다.