이미지·음성 등 상호작용 기능
“놀랍지만 과대광고일 수 있어”
구글이 지난 6일(현지시간) 공개한 거대 언어모델(LLM) 기반 차세대 멀티모달 인공지능(AI) ‘제미나이(Gemini)’를 놓고 구글과 전문가들의 평가가 엇갈리고 있다. 국내외 전문가들은 “구글이 아직 건재하다는 것을 보여줬으나, 혁명적인 수준에는 이르지 못했다”고 평가했다. 멀티모달은 텍스트뿐 아니라 이미지, 음성, 영상 등으로 상호작용하는 기능이다. 전문가들은 제미나이가 멀티모달 AI 시대를 열었다는 데는 동의하면서도, 오픈AI의 최신 LLM ‘GPT-4’를 성능에서 앞서지는 못하는 것으로 판단했다.
구글은 ‘제미나이 1.0’을 공개하면서 “지금까지 구글이 수행한 가장 큰 과학·공학적 결과물”이라며 “GPT-4를 능가하는 최고 수준의 AI 모델”이라고 밝혔다. 제미나이는 적용 대상의 규모·특성에 따라 ‘울트라’ ‘프로’ ‘나노’ 등 3개 모델로 나뉜다. 구글이 가장 앞세운 모델인 울트라는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개 고등 교과목 지식을 조합해 추론 능력을 테스트하는 ‘대규모 다중 작업 언어이해(MMLU)’에서 90.04%의 점수를 기록한 것으로 나타났다. 구글은 GPT-4는 86.4%, 인간 전문가는 89.8%를 받았다고 밝혔다.
반면 전문가들의 의견은 다르다. 하정우 네이버클라우드 AI이노베이션 센터장은 7일 페이스북을 통해 “제미나이가 탑재된 구글의 AI 챗봇 서비스 ‘바드’에 적용된 프로 모델은 GPT-4와 GPT-3.5의 중간쯤으로 보인다”고 밝혔다. 글로벌 AI 스타트업인 업스테이지의 박찬준 테크리더는 “인상 깊은 부분이 많았다”면서도 “평가 방법에서 ‘샷(shot·예제)’을 어떻게 주느냐에 따라 GPT-4가 더 좋은 경우도 보인다”고 평가했다. 미국 매사추세츠 공과대(MIT) 테크놀로지리뷰 사이트는 “제미나이가 놀라워 보이지만 과대광고일 수 있다”는 의견을 게재했다. 제미나이 울트라 모델은 내년 초 출시된다.
이예린 기자 yrl@munhwa.com
“놀랍지만 과대광고일 수 있어”
구글이 지난 6일(현지시간) 공개한 거대 언어모델(LLM) 기반 차세대 멀티모달 인공지능(AI) ‘제미나이(Gemini)’를 놓고 구글과 전문가들의 평가가 엇갈리고 있다. 국내외 전문가들은 “구글이 아직 건재하다는 것을 보여줬으나, 혁명적인 수준에는 이르지 못했다”고 평가했다. 멀티모달은 텍스트뿐 아니라 이미지, 음성, 영상 등으로 상호작용하는 기능이다. 전문가들은 제미나이가 멀티모달 AI 시대를 열었다는 데는 동의하면서도, 오픈AI의 최신 LLM ‘GPT-4’를 성능에서 앞서지는 못하는 것으로 판단했다.
구글은 ‘제미나이 1.0’을 공개하면서 “지금까지 구글이 수행한 가장 큰 과학·공학적 결과물”이라며 “GPT-4를 능가하는 최고 수준의 AI 모델”이라고 밝혔다. 제미나이는 적용 대상의 규모·특성에 따라 ‘울트라’ ‘프로’ ‘나노’ 등 3개 모델로 나뉜다. 구글이 가장 앞세운 모델인 울트라는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개 고등 교과목 지식을 조합해 추론 능력을 테스트하는 ‘대규모 다중 작업 언어이해(MMLU)’에서 90.04%의 점수를 기록한 것으로 나타났다. 구글은 GPT-4는 86.4%, 인간 전문가는 89.8%를 받았다고 밝혔다.
반면 전문가들의 의견은 다르다. 하정우 네이버클라우드 AI이노베이션 센터장은 7일 페이스북을 통해 “제미나이가 탑재된 구글의 AI 챗봇 서비스 ‘바드’에 적용된 프로 모델은 GPT-4와 GPT-3.5의 중간쯤으로 보인다”고 밝혔다. 글로벌 AI 스타트업인 업스테이지의 박찬준 테크리더는 “인상 깊은 부분이 많았다”면서도 “평가 방법에서 ‘샷(shot·예제)’을 어떻게 주느냐에 따라 GPT-4가 더 좋은 경우도 보인다”고 평가했다. 미국 매사추세츠 공과대(MIT) 테크놀로지리뷰 사이트는 “제미나이가 놀라워 보이지만 과대광고일 수 있다”는 의견을 게재했다. 제미나이 울트라 모델은 내년 초 출시된다.
이예린 기자 yrl@munhwa.com
주요뉴스
이슈NOW
기사 추천
- 추천해요 0
- 좋아요 0
- 감동이에요 0
- 화나요 0
- 슬퍼요 0