“사람이 못하는 선적정보 10억건 수집·정리… AI이용 10년만에 완성”

기사 정보
문화일보
입력 2019-07-10 13:01
기자 정보
노성열
노성열
기사 도구
프린트
댓글 0
폰트
공유

photo클릭하시면 더 큰이미지를 보실 수 있습니다


조슈아 그린 ‘판지바’ 사장

“처음엔 무역거래를 해봤던 공장의 점수를 매겨달라고 부탁했다. 공급한 제품 가격, 질 같은 걸 수입사에 평가해달라고 한 것이다. 이 피드백 시스템은 보기 좋게 실패했다.” 조슈아 그린(사진) 판지바 사장은 실패담으로 인터뷰를 시작했다. S&P 글로벌에 인수되기 10년도 훨씬 전에 무역데이터베이스(DB)를 구축하려 시도했던 때의 일화다. 누구도 해본 적이 없던 일이었기에 숱한 시행착오를 겪었으며, 바로 그 고생이 세계 유일의 무역공급망 인공지능(AI)을 탄생시킨 배경이라고 그는 설명했다. 개척자다운 자부심이 표정에서 배어 나왔다.

―무역정보 분석에 AI를 이용한다는 게 어떤 것인가.

“현재 우리는 10억 건보다 많은 선적(船積) 정보를 갖고 있다. 퍼즐 같다. 사람이 이를 직접 맞춘다는 건 불가능하다. 그래서 기술력이 필요하다. 데이터 정리 기술을 개발하려 수년간 노력했다. 규칙 기반(Rule based) 아닌, 기계학습 접근 방식을 택했다. 아주 복잡하기 때문에 사용 가능한 가장 정교하고 수준 높은 기술을 사용했다. 문제를 발견했고, 데이터를 찾았고, AI를 이용해 결국 해결했다. 말하긴 참 쉽다. 하지만 이걸 해낸 시기는 사람들이 AI를 말하기 한참 전인 2007년 무렵이었다.”

―가장 큰 어려움은.

“우선 수집과 정리 단계다. 세관 데이터는 쉽게 구한다. 매일 세관에서 선적 정보가 담긴 3만 개의 CD롬을 받아왔다. 하지만 첫째, 데이터들이 전혀 정리가 안 돼 있었다. 표준화된 물품 설명조차 없었다. 같은 화물을 ‘의류’, 어떤 곳은 ‘남성 재킷’이라 적었다. 나라마다 다르게 정도가 아니라 개인마다 다르게 적을 정도로 심각했다. 둘째, 회사 이름과 주소가 잘못 적힌 경우도 엄청났다. 사람들은 ‘화물정보 (one shipping record)’에는 관심이 없다. 그 화물을 보낸 회사를 알고 싶어 한다. 그러려면 한 회사의 모든 화물을 살펴야 한다. 그런데 화물마다 회사 이름을 다르게, 혹은 잘못 표기한다면 불가능하다. 다음은 데이터를 어떤 식으로 정리해야 더 유용하게 쓰일까 고민했다. 마지막은 사업의 존속이다. 어떻게 돈을 버느냐를 해결하기 위해 많은 시간이 걸렸다.”

―가장 큰 경쟁사는 어디인가.

“선적 정보 제공 회사가 몇 있기는 하다. 하지만 우리 같은 서비스를 제공하는 곳은 없다. 오히려 ‘난 단단한 인맥이 있다’고 말하는 이들, 그런 기성관념이 가장 큰 경쟁 대상이 아닌가 싶다. 비즈니스가 실패하는 결정적 이유는 경쟁에서 도태돼서라기보다 고객과 멀어져서라고 생각한다. 경쟁사들이 뭘 하고 있나 보다 고객이 원하는 것이 뭔가를 파악하는 게 더 중요하다.”

미국(뉴욕) = 노성열 기자 nosr@munhwa.com

※ ‘인공지능 최전선’ 시리즈 기사의 뒷이야기와 자료집, 독자 토론방 등은 네이버 블로그(https://blog.naver.com/neutrino2020)와 페이스북(www.facebook.com/nokija111)에 게재됩니다.
주요뉴스
기사 댓글

AD
AD
count
AD
AD

ADVERTISEMENT

서비스 준비중 입니다.
닫기