스타트업 프리딕티브AI의 윤사중 CEO는 “미국 의대에서 의사가 되기 위해 공부하던 중 제가 의사가 되는 것보다 인공지능(AI) 의사를 만드는 게 적성에 맞고 사회에도 더 많이 기여할 수 있다는 생각을 하게 됐다”며 “이후 몇 번의 도전 끝에 프리딕티브AI를 창업하게 됐다”고 밝혔다.  박윤슬 기자
스타트업 프리딕티브AI의 윤사중 CEO는 “미국 의대에서 의사가 되기 위해 공부하던 중 제가 의사가 되는 것보다 인공지능(AI) 의사를 만드는 게 적성에 맞고 사회에도 더 많이 기여할 수 있다는 생각을 하게 됐다”며 “이후 몇 번의 도전 끝에 프리딕티브AI를 창업하게 됐다”고 밝혔다. 박윤슬 기자


■ 데스크가 만난 사람 - 윤사중 프리딕티브AI CEO

Q. 세계 인공지능 경쟁서 어떻게 살아남을까

의료데이터 진단만으로는 한계
예측 AI로 미래 질병 예방 도전
세계 첫 유전체 AI플랫폼 개발로
안전한 치료·맞춤 예방의학 실현
美존스홉킨스대 겸임교수 활동중

中, 美에 필적할 딥시크 개발 충격
의료 AI도 저비용 고효율이 목표


인터뷰 = 유회경 경제부장 yoology@munhwa.com

“막대한 자금과 인력으로 중무장한 미국 빅테크들과의 인공지능(AI) 경쟁에서 살아남는다는 것은 거의 불가능합니다. 배기량에서 큰 차이가 나는데 고속도로에서 경주를 벌이는 것과 같다고 할 수 있을까요. 다만 AI 분야에선 고속도로뿐 아니라 다양한 길이 존재하는데 우리는 페라리(빅테크)가 제 역량을 발휘할 수 없고, 우리가 잘 달릴 수 있는 골목길(의료 전문 AI)에서 사업을 시작한 셈이죠.”

경기 성남시 분당 네이버 빌딩 5층에서 윤사중 프리딕티브AI CEO를 만났다. 아직 회사 규모가 작아 다른 많은 스타트업들과 함께 사무실을 공유하고 있었다. 공유 회의실 하나를 골라 인터뷰를 진행했다. 오랜 해외 생활 탓에 한국어는 약간 어눌했고 전문 의료 용어(그것도 영어!)가 수시로 튀어나오는 바람에 대화를 이어가는 데 다소 애를 먹긴 했지만 그의 비전과 회사 소개는 특이한 그의 이력만큼이나 인상적이었다. 회사 소개를 부탁하자 윤 CEO는 “맥도날드는 단순한 레스토랑 체인이 아니라 부동산 투자 회사라 할 수 있다”며 대뜸 맥도날드 이야기를 꺼내 들었다.

―왜 그런가.

“회사의 자산과 수익 구조를 분석해 보면 햄버거 판매를 통한 수익보다 부동산 가치가 훨씬 크기 때문이다. 맥도날드는 전 세계 주요 상권에 3만6000여 개 지점을 보유하고 있는데 이 중 45%의 토지와 70%의 건물을 직접 소유하고 있다. 맥도날드는 부동산 임대료 수익과 부동산 가치 상승을 통해 막대한 이익을 창출한다. 즉 햄버거 판매는 부동산 투자를 위한 경상비와 투자 자금 확보 수단이라 볼 수 있다. 병원은 전통적으로 환자 치료 서비스를 제공하는 기관이다. 그러나 최근 의료 데이터 가치가 급증하면서 병원은 데이터 회사로서의 면모를 드러내고 있다. 치료 과정에서 생성되는 방대한 양의 의료 데이터는 진단, 치료법 개발, 예방 의학 등 다양한 분야에서 활용될 수 있으며 그 가치는 치료 서비스를 통한 수익을 훨씬 뛰어넘는다. 병원들도 데이터 기업으로 변모해야 한다.”

―병원이 데이터 기업? 잘 와 닿질 않는다.

“병원에서 매일 생성되는 방대한 의료 데이터는 과거 석유와 같은 전략적 가치를 지닌다. 20세기 중동 산유국들이 석유를 바탕으로 글로벌 영향력을 행사했듯이 AI 시대에는 양질의 의료 데이터를 대규모로 생산하는 기관이 새로운 강자로 부상할 것이다. 특히 주목할 점은 데이터 가치는 단순한 양적 축적을 넘어 통합적 분석에서 발생한다는 것이다. 병원에서 생성되는 의료 데이터는 환자 관련 데이터와 운영 관련 데이터로 구분할 수 있다. 환자 관련 데이터로는 인적사항, 진료 기록, 처방전, 각종 검사결과, 투약기록, 환자 상태 모니터링 데이터, 간호 처치, 유전체 분석 데이터 등이다. 운영 관련 데이터로는 행정 데이터(진료비 청구, 보험 청구, 약제 재고관리, 의료기기 운용 데이터)와 의료 질 관리 관련 데이터(의료사고 보고서, 감염관리 지표, 환전안전 지표) 등이 있다.”

―프리딕티브AI는 무슨 일을 하나.

“자동차 원료로 원유를 직접 사용할 수 없듯이 의료 데이터도 가공되지 않은 원본 상태로는 그 가치를 온전히 발휘할 수 없다. 생물정보학(Bioinformatics), 임상정보학(Clinical informatics)을 통한 정제 과정이 데이터의 실질적 가치를 창출하는 핵심이다. 원유 정제 과정에서 LPG·휘발유·나프타·등유·경유·중유 등이 각각 생산되는 것처럼 의료 데이터 역시 이와 같은 정제 과정을 거치면서 다양한 형태의 가치 있는 정보로 변환된다. 프리딕티브AI는 의료 데이터 정제 회사로 규정할 수 있다.”

실제로 프리딕티브AI는 한국의학연구소(KMI), 가톨릭성모병원 등 국내외 다양한 의료기관과 제약회사와 의료 데이터 활용 관련 제휴를 맺고 있는 상태다. 윤 CEO에 따르면 프리딕티브AI의 AI 기반 데이터 분석은 크게 과거 지향적 분석과 미래 지향적 분석으로 나눌 수 있다고 한다. 과거 지향적 분석은 무엇이 일어났는지 확인하는 ‘기술(記述·descriptive) AI’와 왜 이러한 일이 발생했는지 설명함으로써 데이터 내 인과 관계를 밝히는 ‘진단(diagnostic) AI’가 있다. 하지만 과거 데이터만으로는 한계가 있다. 미래에 일어날 일을 예측하는 것이 ‘예측(predictive) AI’의 역할이고 여기에서 사명을 따왔다. 예측 AI와 함께 미래 지향적 분석에 속하는 ‘처방(prescriptive) AI’는 여러 예측 시뮬레이션을 통해 특정 환자나 상황에서 최적의 해결책을 제시하는 단계다.

―예측 AI 과정에서 구현하는 ‘디지털 트윈’은 무엇인가.

“과거 지향적 분석과 미래 지향적 분석을 초개인화해 디지털 플랫폼에서 구현한 환경이 디지털 트윈이다. 과거 데이터를 기반으로 미래 시나리오를 가상으로 구현, 실제로 발생할 가능성이 큰 결과를 시뮬레이션하는 것이다. 디지털 트윈을 활용할 경우 사전에 고위험성 질병을 예방할 수 있고 의료·의약 치료 이전에 본인의 디지털 트윈에 시뮬레이션해 보다 정확하고 안전하게 치료할 수 있다. 또 의학적 근거를 실시간으로 제공해 임상 정밀의학 구현이 가능하다. 국제적으로 인정받은 15개의 독립 데이터베이스(DB)를 활용해 최초로 융합 DB를 구축했으며 이를 바탕으로 세계 최초의 유전체 기반 인간 디지털 트윈 AI 플랫폼을 만들었다. 디지털 트윈 클라우드 DB를 통해 2만2000여 개 유전 관련 질병과 대조하고 210여 개 약물에 대한 민감도를 예측할 수 있다. 맞춤형 예방 의학이 가능한 셈이다.”

―이러한 사업이 어떻게 가능했나.

“고등학생 시절 미국으로 이민을 간 뒤 유전체 분야 연구에 22년 동안 몸을 담았다. 유전체 분석(WGS·Whole Genome Sequencing) 비용도 많이 떨어졌는데 왜 좋은 연구 결과와 발견이 우리 생활에 도움을 주지 못한 채 썩혀지고 있을까 하는 문제의식 속에서 역시 미국에서 같은 분야에서 연구 활동 중인 쌍둥이 형과 함께 2020년 창업(프리딕티브케어)을 하게 됐다. 외부에 잘 알려지지 않았지만 한국은 질 좋은 의료 데이터의 보고다. 전 세계에 이런 곳은 없다. 데이터 질이 우수해야 서비스가 보다 정교해진다. 우리가 한국 관련 사업을 중시하지 않을 수 없는 이유다.”

윤 CEO와 형인 윤시중 과학담당임원(CSO) 둘 다 미국 존스홉킨스대에서 겸임 교수로 활동 중이다. 프리딕티브AI는 현재 한국(프리딕티브AI)·미국(프리딕티브케어)·아랍에미리트(UAE)(프리딕티브중동) 등 세 곳에 거점을 두고 사업을 진행하고 있다. 프리딕티브AI는 2023년 9월 설립됐다.

―향후 계획은.

“이미 구축한 디지털 트윈을 활용해 다양한 사업을 해나가려 한다. 일단 코로나19 진단키트처럼 휴대용 암 진단 장치를 만들고자 한다. 3년 정도 보고 있는데 만일 제품이 현실화된다면 암 발병률을 획기적으로 줄일 수 있을 것이다.”

인터뷰를 마친 뒤 중국 AI ‘딥시크(DeepSeek)’ 사태가 터졌다. 그는 어떻게 생각하는지 궁금해 연락을 취했다.

윤 CEO는 “생성형(generative) AI 분야에서 저렴한 비용으로 미국 빅테크에 필적하는 결과를 냈다는 것 아닌가. AI 업계가 엄청난 충격을 받았다. 빅테크의 아성은 높지만 지레 포기할 필요는 없을 것 같다. 우리도 딥시크처럼 의료 AI 분야에서 저렴한 가격으로 획기적인 서비스를 내는 게 목표다”라고 밝혔다.




생성형 AI·LLM 대세지만… 의료 기계학습에 집중 ‘인간 디지털 트윈’ 만들어

■ 프리딕티브AI의 성과는


2000년 이후 인공지능(AI) 분야에선 두 가지 큰 사건이 있었다. 하나는 2016년 3월 바둑 대결에서 미국 구글 딥마인드의 바둑 전문 AI ‘알파고’가 이세돌 9단을 꺾은 사건이었다. 알파고 대성공 이후 세상의 거의 모든 문제를 딥러닝 기술을 활용해 해결할 수 있다는 딥러닝 만능주의가 크게 유행했다. 딥러닝은 기계를 끊임없이 학습시켜 똑똑하게 만드는 기계학습의 한 분야다. 기계학습은 어린아이가 모국어를 배우는 과정과 비슷하다. 초기 성능은 형편없지만 인내심을 갖고 계속 AI를 학습시키면 알파고가 이 9단을 꺾었던 것처럼 높은 성능에 도달할 수 있다는 것이다. 하지만 기계학습 한계가 곧 드러났다. 기계학습을 활용해 최종적인 AI 서비스를 개발하는 데에는 너무 많은 돈과 인력, 시간이 필요했던 것이다. 가령 비용 절감이나 인력 감축을 위해 AI를 도입하는데 오히려 비용이 증가하거나 인력이 더 많이 필요하게 되는 역설이 발생했다. 여기에 더욱이 주어진 문제 해결을 위해선 매번 새롭게 접근해야 하는 AI 프로젝트 특성이 더해지면서 기계학습에 대한 기대감은 급격히 식어갔다.

이런 상황에서 2022년 말 ‘챗GPT’가 등장했다. 이후 AI 역사는 크게 달라졌다. 챗GPT는 ‘생성형(Generative) AI’로 불리는데 이는 사용자가 문장이나 문단 형태로 질문하면 AI가 문장이나 문단 형태의 답을 생성해서 보여주기 때문이다. 미국 구글은 2017년 자연어 처리를 위해 ‘트랜스포머’라는 AI 모델을 발표했고 이 모델이 출발점이 돼 수많은 ‘대규모언어모델(LLM)’이 파생됐다. 미국의 오픈AI라는 회사는 수많은 LLM 중 하나인 GPT를 활용해 챗GPT라는 생성형 AI 서비스를 만들어 세상에 공개한 것이다. LLM은 사진과 영상 제작, 작곡 등 글과 무관해 보이는 분야와 문제들에서도 활용될 수 있다.

당초 기계학습의 낮은 생산성을 극복하기 위해 대두한 기술이 ‘초거대 AI’다. 대규모 빅데이터를 활용, AI를 기계학습시켜 범용적으로 사용할 수 있는 AI 모델을 개발하는 기술을 말한다. 하지만 초거대 AI는 막대한 자본이 있어야 만들 수 있기 때문에 작은 기업은 시도조차 어렵다. 이에 따라 기계학습과 초거대 AI의 중간에 해당하는 LLM이 현실적인 대안이 됐다. 기계학습이 마트에서 식재료를 사와 직접 요리해서 먹는 경우이고 초거대 AI가 식당을 하나 차리는 것이라면 LLM은 밀키트를 구매해서 냄비 안에 넣고 끓여 먹는 경우라 비유할 수 있다. 하지만 LLM도 주어진 문제에 특화시키려면 ‘전이학습(Fine Tuning)’과 특정 데이터에 근거해 답변하도록 만드는 기술인 ‘RAG’를 적극 활용해야 한다. LLM이 대세를 이루고 있지만 문제 특화 측면에서만 보면 기계학습이 LLM보다 유리하다는 평가다. 프리딕티브AI는 의료 분야 기계학습에 집중, 유전체 기반 인간 디지털 트윈을 만든 게 특징이다.
유회경

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0