[주목! 이사람]'높임말 번역' 개발한 박은정 네이버 파파고 테크리더 "기술로 언어 장벽 낮추고파"
파파고 올해 1월 높임말 번역 기능 도입..5개월 만에 상용화"한때는 인간 번역기..기술을 활용해 언어 장벽 낮추고파"파파고, 월간 활성 사용자 1000만 돌파..앱에선 구글 앞서"오프라인에서도 통·번역 가능한 파파고 연내 출시 준비"
네이버가 제공하는 인공지능(AI) 통·번역 서비스 파파고(Papago)에 박은정(34) 테크리더 이야기다. 그는 지난 2016년 파파고팀에 합류했다. 당시만 해도 국내에서 AI 통·번역을 연구하는 곳은 네이버가 유일했다. 그는 기계를 학습시켜 최대한 자연스럽고, 완벽에 가까운 번역을 제공하는 일을 하고 있다. 이른바 번역 품질을 고도화하는게 테크리더의 몫이다. 박 리더는 지난 1월 높임말 번역 기능 개발을 이끈 주역으로 AI 번역계에서 떠오르는 젊은 연구자로 주목받고 있다. 높임말 번역은 텍스트 번역 후 '높임말 온·오프(ON/OFF)' 스위치를 켜면 한국어 특성을 고려해 '나'를 '저'로, '너'를 '당신', '했다'를 '했습니다' 등으로 바꿔준다. 네이버 본사에서 만난 박 리더는 "AI 번역은 사람이 아닌 기계가 하다보니 뉘앙스나 문화적 배경을 고려하는 것도 필요하다. 특히 영어를 한국어로 번역할 때 스타일이 제각각인데 그 중에서도 높임말이냐, 예삿말이냐의 차이가 중요하다는 점에 주목했다"며 "인공신경망 번역에 높임말 토큰을 넣어 높임말을 이해할 수 있게 만드는 작업을 했다"고 설명했다. 한국어를 배우기 시작한 외국인들의 경우 높임말 기능을 사용하면 어르신들에게 반말을 하는 무례함을 피할 수 있다. 해외 원서나 논문 등 긴 영어 문장을 높임말로만 번역하고 싶을 때도 번역 문체를 통일해 준다. 높임말 서비스는 지난해 지난 9월 모델 개발을 시작해 올해 1월 적용됐다. 박 리더는 높임말 번역 기능을 통해 수집되는 학습데이터를 AI가 스스로 학습하며 높임말 번역 품질을 고도화해 나갈 수 있도록 설계했다. 반말과 높임말을 함께 제공했던 것과 달리 2개 이상의 문장을 동시에 입력해도 일관되고 자연스러운 높임말 번역을 선보인다. 파파고 내부적으로는 높임말 변환율이 90% 이상으로 평가하고 있다. ◇월간 활성 사용자 1000만, 구글의 아성을 뛰어넘다 파파고는 2016년 8월 시범 서비스를 시작한 뒤 2017년 7월 정식 출시됐다. 이후 1년 9개월 만인 올해 3월 월간 활성 이용자수(MAU)가 1000만명을 돌파했다. 누적 다운로드는 2000만건을 넘으며 지난해 8월부터 국내 모바일 통번역 앱 다운로드 1위를 유지하고 있다. 현재 14개 언어를 지원한다. 많이 통번역되는 언어는 영어, 일본어, 중국어, 베트남어 순이다. 세계적으로 AI 통번역을 선도하고 있는 구글의 아성도 뛰어넘었다. 시장조사업체 앱애니에 따르면 국내 앱 기준 파파고의 MAU는 지난해 8월 구글 통번역 앱을 넘어선 데 이어 지난 3월에는 565만명으로 구글(473만명)을 100만명 가량 추월했다. 박 리더는 "인간이 구사할 수 있는 무한대의 문장을 평가하는 것은 한계가 있지만 꾸준히 번역 품질을 높이고, 최적화된 사용자환경 등을 통해 쉽고, 사용하기 편리한 앱을 제공한 것이 사용자들의 선택을 받은 비결로 보인다"며 "파파고가 중점으로 삼고 있는 한국어, 중국어, 영어 등 언어에 대해서는 전세계 어디에 내놓아도 뒤지지 않는다"고 자부했다. 파파고는 음성 인식은 물론 웹사이트 번역, 이미지 번역을 제공하고 있다. 일본어 버전에 한해 사진을 찍으면 문자를 인식해 번역해 주는 OCR 기술의 정확도를 높이고 있으며, 연내 한국어·영어·중국어로 확대 적용될 전망이다. 특히 파파고는 올해 하반기 인터넷을 연결하지 않아도 파파고 서비스를 이용할 수 있도록 준비하고 있다. 오프라인 앱은 인터넷이 원활하지 않은 국가나 지역을 여행하는 이용자들을 위한 서비스다. 필요한 언어 데이터를 다운로드받아 이용하는 방식이 될 것으로 보인다. 박 리더는 "기존의 파파고는 서버랑 통신을 계속하는 번역기이지만 오프라인 번역기를 연구하고 있다"며 "파파고 모델 자체를 유저의 핸드폰에 바로 탑재해 번역할 수 있는 모델을 올해 중에 선보일 예정이다. 가장 중요한 것은 용량으로 방대하고 엄청난 정보를 어떻게 작게 변환할 수 있을 지가 관건이다"고 밝혔다. ◇영어 피로감? AI 번역 시대, 외국어 학습 물었더니 많은 사람들이 외국어 학습에 피로감을 호소하고 있다. 최근 논문이나 기술 등이 대부분 영어로 작성된 데다 외국인과 교류할 기회도 꾸준히 늘고 있기 때문이다. 이로 인해 박 리더는 주변에서 "AI 번역기가 고도화되면 과연 외국어 공부를 할 필요가 있느냐"는 질문을 가장 많이 받는다. 그는 "언어를 배우는 것은 단순히 외국어 학습을 넘어 문화까지 배우는 것이다. 기술에 대한 믿음이 없어서가 아니라 언어를 배우는 일은 여전히 재미있는 일"이라며 "외국인 친구와 친밀한 대화를 나누고 싶은데 번역기를 켜고, 입력한 후 화면을 보여주는 과정에서 어색함이 생기기 마련이다. 지금 당장 친밀감 같은 것은 AI 번역기가 할 수 없는 일들로 보이지만 어떤 상황에서도 완벽한 사용자 경험을 주기 위해 매진하고 있다"고 말했다. 기계번역 기술은 진화를 거듭하며 엉뚱한 문장으로 해석하는 '발번역'의 오명을 차차 벗고 있다. 단어 단위로 번역해 문장을 완성하는 방식을 벗어나 사람처럼 문맥을 읽는 '인공 신경망 기술'이 발전한 데 따른 것이다. 다만 더욱 완벽한 기계 번역으로 나아가기 위해선 오픈된 데이터도 필수다. 학교든, 기업이든 누구든지 데이터를 모아서 공개해야 한다. 끝으로 박 리더는 "AI 번역은 사람들의 생활과 밀접한 영역이다. 사람이나 기업이 해외로 나가서 뭔가를 한다고 했을 때 소통을 도와주는 도구이자 일종의 국경을 넘나드는 기초 기술"이라며 "번역의 대중화를 통해 누구나 쉽게 번역을 이용할 수 있는 서비스로 만들고 싶다"고 밝혔다. [email protected] |