
■ 복합위기, 新 기술혁신으로 넘는다 <끝> - <19> 카카오
한국어 AI 언어모델 ‘KoGPT’
영어·일본어 버전 등도 준비
질병판독·진단 가능한 AI 연구
고려대 병원 등과 업무협약도 끝>
‘시를 쓰는 이유를 묻지 말아 주십시오. / 그냥 쓰는 것입니다. / 쓸 수밖에 없기에 씁니다. / 무엇을 쓰는지는 중요하지 않습니다. / 시를 쓴다는 것은 세상에서 가장 짧은 말을 하는 것입니다.’(‘시를 쓰는 이유’)
카카오의 인공지능(AI) 연구 전문 자회사 카카오브레인은 올해 AI 시인 ‘시아’를 선보였다. 미디어아트 그룹 슬릿스코프와 협업하여 탄생한 시아는 인터넷 백과사전, 뉴스 등을 읽으며 한국어를 공부하고 1만3000여 편의 시를 읽고서 작법을 배웠다. 8월 첫 번째 시집 ‘시를 쓰는 이유’(총 53편)를 출간했으며 현재 1쇄가 완판됐다.
시아는 카카오브레인이 지난해 11월 공개한 ‘GPT-3’ 모델의 한국어 특화 AI 언어모델 ‘KoGPT’를 기반으로 개발됐다. KoGPT는 300억 개의 매개변수와 2000억 개 토큰(token)의 한국어 데이터를 바탕으로 구축됐다. 카카오브레인은 앞으로 KoGPT의 영어 및 일본어 모델을 준비해 공개할 계획이며 베트남어, 말레이시아어 등 동남아어 버전으로도 개발할 예정이다.
카카오브레인은 언어모델뿐만 아니라 AI 멀티모달(multimodal) 이미지 생성 모델의 고도화에도 힘쓰고 있다. 카카오브레인은 지난해 12월 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델 ‘민달리(minDALL-E)’를 공개했고, 올해에는 업그레이드 버전인 ‘RQ-트랜스포머(RQ-Transformer)’를 선보였다.

카카오브레인은 이를 발전시켜 AI 아티스트 ‘칼로’를 탄생시켰다. 칼로는 1억2000만 장 규모의 텍스트와 이미지 데이터를 학습해 다양한 화풍과 스타일로 이미지를 생성시킨다.
칼로는 현대미술가 고상우 작가와 공동 작업으로 생성한 디지털 작품으로 전시회를 열기도 했다. 칼로가 생성한 호랑이 그림에 고 작가의 드로잉이 더해져 작품이 탄생했다. 해당 작품은 맨투맨 티와 머그컵에 새겨져 판매되기도 했다. 낭비 없는 생산을 위해 주문 수량만큼 제품을 생산하는 카카오메이커스의 환경친화적 주문제작 방식(POD 생산)으로 판매됐다. 카카오메이커스는 판매된 제품의 수익금 전액을 세계자연기금(WWF)에 기부하기로 했다.
카카오브레인 관계자는 “AI 아티스트 칼로가 생성한 예술 작품으로 멸종 위기 동물 보호 활동에 동참하게 됐다”며 “앞으로도 우리의 AI 기술을 통해 사회에 환원할 수 있는 의미 있는 프로젝트에 계속 참여하겠다”며 포부를 말했다.
최근에는 초거대 이미지·텍스트 데이터셋인 ‘코요’도 공개했다. 약 7억4000만 개의 이미지와 텍스트로 이뤄진 코요는 독자 개발한 기술로 이미지와 텍스트를 온라인에서 자동 수집한다. 이를 통해 투입되는 비용과 시간을 줄이고, 양질의 데이터를 선별할 수 있도록 했다.
카카오브레인은 개발한 AI 기술을 헬스케어 분야에도 집중해 투자할 계획이다. ‘갤럭스’와 AI 기반의 항체 신약 설계 플랫폼 구축을 위한 공동 연구를 진행하고 있으며, 가톨릭중앙의료원·고려대안암병원과 의료 분야 내 초거대 AI 모델 연구를 위한 업무협약(MOU)도 체결했다.
유방암 등 특정 질병을 타깃으로 연구·개발(R&D)을 시작해 일반적인 질병에 대한 판독 및 진단도 가능하게 한다는 계획이다.
AI 기술을 활용한 서비스도 준비 중이다. ‘상호작용형(Interactive) AI’는 얼굴의 움직임을 실시간으로 추적하는 ‘페이스 리타기팅’과 또 다른 자아를 구현할 수 있는 ‘뉴럴 렌더링’을 가능하게 한다. 쉽게 자신만의 캐릭터를 만들고 멀티 페르소나를 표현할 수 있도록 돕는다.
‘대화형(Conversational) AI’는 가상 인물과 콘텐츠를 기반으로 친구처럼 대화할 수 있는 기능이다. 인기 웹툰을 데이터로 주인공의 성격과 가치관, 말투, 뉘앙스를 지닌 AI를 만들고, 웹툰에 대해 대화를 나누는 식이다. 이와 같은 기능은 추후 카카오 서비스에 적용될 예정이다.
카카오브레인은 특히 이같이 개발한 초거대 AI 모델을 오픈소스로 공개하고 있다. KoGPT도 최대 오픈소스 커뮤니티 깃허브(github)에 공개한 바 있다. 기술과 연구 결과물을 활용해 사회의 다양한 문제 해결에 이바지하고, 여러 분야와 접목해 초거대 AI 생태계를 구축해 간다는 취지에 따른 것이다.
김일두 카카오브레인 대표는 “AI가 사람처럼 생각하고 말하려면 어떤 요소가 필요할지, AI에 기억력·추론 능력·이해 능력이 있다면 사람처럼 소통할 수 있을지 등 끝없이 질문을 던지며 연구하고 있다”며 “연구자들의 기술 접근성을 높이자는 취지에서 오픈소스로 공개해 국내 정보기술(IT) 생태계 발전에 이바지할 것”이라고 말했다.
김병채 기자 haasskim@munhwa.com
/ 제작후원/
삼성전자, 현대자동차그룹, SK, 롯데, 포스코, 한화, 이마트, KT, CJ, 카카오, 두산, 네이버
주요뉴스
시리즈
이슈NOW
기사 추천
- 추천해요 0
- 좋아요 0
- 감동이에요 0
- 화나요 0
- 슬퍼요 0