막오른 '초거대 AI' 주도권 경쟁…"범용 AI 시대 연다"
"초거대 AI, 인간 뇌와 유사하게 설계돼 종합·자율적 판단 가능"네이버 '하이퍼클로바' 출시로 국내서 가장 앞서…카카오 'KoGPT' 내놓아LG AI 연구원, 오는 14일 출범 1주년 행사서 공개 전망SKT 국립국어원과 개발 박차…KT AI 원팀 내년 상반기 공개 계획초거대 AI는 인간의 뇌 구조와 유사하게 설계돼, 종합적·자율적으로 사고·학습·판단·행동하는 AI를 의미한다. 특정 분야에 한정되지 않고 모든 영역에서 활용할 수 있는 범용 AI 시대를 열기 위한 핵심 기술이다. 일반 컴퓨터보다 연산 속도가 훨씬 빠른 슈퍼컴퓨팅 인프라를 기반으로 대용량 데이터를 학습해 인간의 뇌에 준하는 수준으로 정교하고 종합적인 사고가 가능한 것을 목표로 한다. 특히 자연어, 즉 인간처럼 언어를 이해하고 구사할 수 있게끔 개발되고 있다. 12일 IT 업계에 따르면 국내에서 초거대 AI 개발에 가장 앞서고 있는 기업은 네이버다. 지난 5월 국내 첫 초거대 AI이자 한국어로 된 세계 최대 언어모델인 '하이퍼클로바'를 공개했다. 하이퍼클로바는 뉴스 50년치, 네이버 블로그 9년치에 해당되는 양의 한국어 데이터를 학습한 것으로 알려졌다. 이를 기반으로 상품 이름·구매자 리뷰 핵심 요약, 쇼핑기획 등을 해내고 있다. 특히 세계 최대 초거대 AI인 'GPT-3'(1750억개)보다 많은 2040억개의 매개변수(=파라미터, 컴퓨터프로그램의 함수에 입력되는 데이터들로, AI 모델의 크기를 의미함) 규모로 개발돼 주목을 받았다. 'GPT-3'는 일론 머스크 테슬라 최고경영자(CEO) 등이 주도해 2015년 설립한 미국의 비영리 AI 연구기관 오픈AI가 지난해 내놓은 GPT 시리즈 세 번째 언어모델이다. 역대 최고의 자연어 처리 기반 AI로 평가받는다. 인간과 훨씬 자연스럽게 대화하고 소설·시·칼럼을 써내 화제를 모았다. 현재는 인간 뇌와 비교할 수 있는 약 100조개 매개변수를 갖춘 GPT-4를 준비 중이다. 인간 뇌에는 평균 100조개의 신경전달물질인 뉴런이 있다. 네이버는 하이퍼클로바를 검색, 쇼핑 등 다양한 서비스 분야 외에도 활용 분야를 지속적으로 확대할 계획이다. 네이버는 지난달 25일 개최한 개발자 대상 행사인 '데뷰 2021'에서는 하이퍼클로바를 텍스트와 음성 외에 이미지도 함께 이해하게끔 개발하겠다고 발표했다. 또 전문가가 아닌 누구나 접근 가능한 플랫폼으로 진화시켜 하이퍼클로바의 생태계를 확장한다는 전략도 공유했다. 카카오도 초거대 AI를 내놓아 맞불을 놓았다. 카카오의 AI 전문 자회사 카카오브레인은 지난달 16일 'GPT-3' 모델을 활용한 한국어 특화 초거대 AI 언어모델 'KoGPT'의 기술을 오픈소스 커뮤니티인 '깃허브'에 공개했다. KoGPT는 글로벌 AI 언어모델 'GPT-3'를 한국어 특화모델로 강화한 것으로 매개변수는 60억개다. 카카오브레인은 KoGPT 기술을 자사 서비스에 적용하는 것을 넘어 외부 개발자에 핵심 기술을 공개, 초거대 AI 생태계 구축에 나설 계획이다. 이에 따라 카카오브레인의 KoGPT가 활용된 다양한 AI 서비스가 출시될 것으로 기대되고 있다. 또한 카카오는 KoGPT를 기반으로 '디지털 휴먼'을 개발하고 있다. 초거대 AI라는 기능적인 측면에 인공의 캐릭터나 가상의 사람 모습을 결합해 궁극적으로 카카오의 모든 이용자에게 친근하면서도 유용한 디지털 휴먼을 완성해나가고자 한다는 구상이다. LG그룹은 AI 전담조직인 LG AI 연구원을 통해 향후 3년간 1억 달러(약 1120억원) 투자 계획까지 밝히며 초거대 AI 개발에 나선 상태다. LG AI연구원 오는 14일 출범 1주년을 맞아 개최하는 'LG AI 토크콘서트-더베스트 오브 2021' 행사에서 6000억개 매개변수를 갖춘 초거대 AI를 공개할 예정이다. 더 나아가 내년 상반기에는 조 단위 매개변수를 가진 AI도 개발한다는 목표다.
국내 최대 통신사 SK텔레콤은 지난 4월부터 국립국어원과 한국어에 최적화된 차세대 AI 언어모델 'GLM'을 개발하기 위해 협력 중이다. 1500억개 매개변수를 기반으로 GPT-3과 비슷한 성능을 가진 한국어 범용 언어모델을 목표로 한다. SKT는 연말까지 GLM을 개발해 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행하고, 다양한 서비스에 적용할 계획이다. 특히 SKT는 GLM이 한국어 AI 언어 모델의 결정판이 될 것으로 예상했다. 한국어로도 언어 관련 문제풀이, 글짓기, 번역 및 주어진 문장에 따라 간단한 코딩을 수행하는 기능을 구현할 수 있게 되는 것이다. 동시에 일상의 감성대화, 다양한 업종의 고객센터 대화뿐 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어 활동에 적용될 수 있을 것으로 관측했다.
KT도 국내 주요 기업·연구기관과 AI 원팀을 꾸려 초거대 AI 모델을 개발하고 있다. AI 원팀 구성원은 현재 KT, 현대중공업그룹, LG전자, LG유플러스, 한국투자증권, 동원그룹, 우리은행, 한진, 한국과학기술원(KAIST), 한양대, 한국전자통신연구원(ETRI) 등으로 꾸려졌다. AI 원팀은 지난달 개최한 'AI 원팀 서밋 2021'에서 이르면 내년 상반기까지 2000억 매개변수 이상의 초거대 AI 모델을 개발해, AI 음성인식 단말기인 기가지니3 등 참여기관의 다양한 사업에 적용한다는 계획을 밝혔다. 이렇게 빅테크 기업들이 초거대 AI 기술 개발에 적극 나선 이유는 수많은 분야로 활용 가능한 범용 AI 개발을 하기 위한 핵심 기술로 여기기 때문이다. 가령 한 인간의 뇌처럼 언어를 이해하고 구사함에 따라 다양한 분야에서 인간의 일을 대체할 수 있는 등 확장성이 무궁무진하다. 초거대 AI 개발은 미래 기술 종속을 피하고 AI 주권을 지키기 위해서도 필수적이다. 해외 기업의 초거대 AI는 영어·중국어 기반으로 함에 따라 한국어 고객에게 좋은 서비스를 제공하려면 자체 기술을 확보하고 한국어로 학습한 모델을 개발해야 한다. 더 나아가 AI 기술을 개발하지 않으면 글로벌 IT 공룡들에 서비스가 종속될 수 있다. IT 업계 관계자는 "국내 기업뿐 아니라 마이크로소프트(MS), 구글 등도 초거대 AI 개발에 과감한 투자를 감행하고 있는 것은 관련 시장의 성장성이 그만큼 크기 때문이다"며 "모든 영역에서 활용할 수 있는 범용 AI를 개발하기 위해선 초거대 AI 기술은 필수적이다"고 말했다. ◎공감언론 뉴시스 [email protected] |