■ 4월말까지 세계 대회 개최

기존 학습한 데이터 기반으로
처음 본 이미지 설명 정확도 평가
의학 영상분석 등 활용 무궁무진
6월 세계적 권위 학회서 워크숍


LG그룹의 초거대 인공지능(AI) 개발을 주도하고 있는 LG AI연구원이 이미지를 이해하고 설명할 수 있는 ‘이미지 캡셔닝’ 기술 분야로 연구 영역을 빠르게 확장한다. LG는 최근 대화형 AI 챗봇인 ‘챗GPT’가 자연어 검색 분야에서 큰 반향을 일으킨 것처럼 AI가 스스로 이미지를 이해하고 해시태그까지 달 수 있는 ‘이미지 캡셔닝’ 기술이 이미지 검색 분야에 혁신을 불러올 것으로 기대하고 있다.

LG AI연구원은 초거대 AI ‘엑사원(EXAONE)’을 공동 연구하고 있는 서울대 AI대학원, 이미지 캡셔닝 AI의 상용화 서비스를 함께 준비하고 있는 셔터스톡과 오는 2월 1일부터 4월 말까지 전 세계 AI 연구자를 대상으로 ‘LG 글로벌 AI 챌린지’를 연다고 31일 밝혔다.

‘LG 글로벌 AI 챌린지’는 ‘제로샷 이미지 캡셔닝(Zero-Shot Image Captioning)’을 주제로 AI가 처음 본 이미지를 얼마나 정확하게 이해하고 설명하는지를 평가하는 세계 최초의 대회다. ‘제로샷 이미지 캡셔닝’은 마치 사람의 시각 인지 능력처럼 AI가 처음 본 사물이나 동물, 풍경 등이 포함된 이미지를 보거나 삽화, 그래픽 등 표현 방식이 다른 이미지를 봤을 때 기존 학습한 데이터를 기반으로 스스로 이해하고 유추한 결과를 텍스트로 설명할 수 있는 기술을 뜻한다. 예컨대 토끼를 한 번도 본 적이 없는 사람이 토끼 여러 마리와 고양이 한 마리가 함께 있는 것을 봤을 때 ‘토끼도 털은 있지만, 고양이와는 다르게 귀가 길고, 뒷다리가 발달했다’고 설명할 수 있는 것처럼 ‘제로샷 이미지 캡셔닝’의 작동 구조도 이와 비슷하다.

연구원은 ‘제로샷 이미지 캡셔닝’ 기술이 고도화하면 사람들의 실생활에 직접 도움을 줄 수 있는 기술 개발로 이어질 것으로 보고 있다. 연구원 관계자는 “AI가 자동으로 캡션과 키워드를 생성해 검색의 편의성과 정확도를 높일 수 있다”며 “의학 전문 데이터를 추가로 학습할 경우 의학 영상을 분석하는 ‘의학 전문가 AI’로 활약할 수도 있을 것”이라고 설명했다.

LG AI연구원은 올해 6월 캐나다 밴쿠버에서 열리는 컴퓨터 비전 분야 세계 최고 권위 학회인 ‘CVPR 2023’에서 ‘제로샷 이미지 캡셔닝 평가의 새로운 개척자들’을 주제로 워크숍도 진행할 예정이다. ‘LG 글로벌 AI 챌린지’ 최종 수상팀은 이날 행사에서 성과를 발표할 기회가 주어진다. 이경무 서울대 AI대학원 석좌교수는 “세계 최초로 제로샷 이미지 캡셔닝 대회와 워크숍을 진행하는 것은 우리나라의 AI 역량이 이미 세계적인 수준에 도달했다는 것을 의미한다”고 말했다.

장병철 기자 jjangbeng@munhwa.com
장병철

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0