미국과 홍콩 증시에 동시 상장해 있는 알리바바홀딩스.  AP 연합뉴스
미국과 홍콩 증시에 동시 상장해 있는 알리바바홀딩스. AP 연합뉴스

중국 빅테크(거대 정보기술기업) 알리바바가 외부 검색엔진을 사용하지 않는 새로운 인공지능(AI) 훈련 방법을 개발했다고 홍콩 사우스차이나모닝포스트(SCMP)가 12일 알리바바의 최신 논문을 인용해 보도했다.

논문 공개 사이트 아카이브(arXiv) 등에 발표된 이 논문에 따르면 구글 등에 고가의 응용 프로그램 인터페이스(API) 비용을 지불하지 않고도 정보검색 능력을 훈련할 수 있는 ‘제로서치’라는 새로운 강화학습 방식으로 훈련비용을 90% 정도 절감할 수 있는 것으로 나타났다.

알리바바 연구진은 논문에서 “효과적인 정보 검색은 대규모언어모델(LLM)의 추론과 생성 기능을 향상하는 데 필수적이지만, 검색엔진의 문서 품질을 예측할 수 없어 강화학습(RL) 과정에 불안정성을 초래하고 수십만 건의 검색 요청 등이 필요해 상당한 API 비용을 발생시킨다”고 지적했다.

연구진은 “이런 문제를 해결하기 위해 실제 검색엔진과 상호작용하지 않고도 LLM의 검색 능력을 훈련할 수 있는 ‘제로서치’를 도입했다”고 밝혔다.

‘제로서치’ 방식은 간단한 지도미세조정(supervised fine-tuning)을 통해 LLM을 검색 모듈로 변환해 쿼리(질의)에 대한 응답으로 관련성 있는 문서와 노이즈 문서를 모두 생성하도록 한다.

특히 구글 검색 API를 활용해 6만4000건의 질의를 처리하려면 586.7달러(약 82만1000원)의 비용이 들지만, 엔비디아의 A100 그래픽처리장치(GPU) 4개로 구성된 14B 모델에서 훈련하는 비용은 70.8달러로 88%의 비용 절감 효과를 얻을 수 있다고 강조했다.

황혜진 기자
황혜진

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0