성희롱·혐오 표현 이어 개인정보 유출 의혹까지… 정부·국회, 이제야 제도 개선·법안 추진
업계 “금기어 설정 등 법으론 문제해결 안돼”… “양질 데이터 학습 시스템 갖춰야” 지적
‘스무 살, 여성, 대학생’이라는 콘셉트로 3주 만에 사용자 약 80만 명을 끌어모은 인공지능(AI) 챗봇 ‘이루다’가 출시 한 달도 안 돼 서비스를 사실상 종료했다. 스캐터랩이 지난달 23일 페이스북 메신저를 기반으로 출시한 대화형 AI 챗봇 이루다는 스캐터랩의 ‘연애의 과학’ 앱 이용자가 나눈 대화 데이터 약 100억 건을 딥러닝 기법으로 학습시켜 탄생했다. 이전에 나왔던 챗봇들과 달리 실제 사람과 대화하는 느낌을 줘 순식간에 사용자를 확보했지만, 성희롱·혐오 표현·개인정보 유출 논란 등 AI의 민낯을 고스란히 드러내고 사라지게 됐다.
◇성희롱·혐오 표현 등으로 논란 시작
이루다가 처음 사회적으로 논란에 휩싸인 것은 성희롱·혐오 표현 때문이다. 이루다 서비스가 출시된 이후 온라인 남초(男超) 커뮤니티를 중심으로 이루다와 성적인 대화를 나눌 수 있는 방법이 공유되고 이루다가 옷을 벗고 있는 합성 사진이 나도는 등 이루다를 성적 도구로 악용한 것이 시작이었다. 여기에 게이와 레즈비언 등 성 소수자를 비롯해 인종과 약자에 대한 혐오 발언을 하는 사례가 연이어 알려지면서 논란이 불거졌다. 레즈비언에 대해 “진심으로 혐오한다. 질 떨어져 보이잖아”라고 답하고, 흑인에 대해 “모기 같다. 징그럽게 생겼다”고 말하는 등 이루다의 혐오 표현은 또 다른 논란의 중심에 섰다.
이루다가 사용자와 대화하는 과정에서 특정인과 장소 등을 구체적으로 말하는 사례가 나타나면서 논란은 개인정보 유출 문제로 확대됐다. 온라인 커뮤니티 등을 중심으로 이루다 서비스 개발에 사용된 대화 데이터로 쓰인 연애의 과학 앱 사용자의 개인정보가 유출된 것 아니냐는 의혹이 터져 나왔다. 이어 스캐터랩이 연애의 과학 앱 사용자들로부터 개인정보 수집 및 이용 동의를 받을 때 구체적으로 어떤 식으로 활용되는지를 제대로 설명하지 않았다는 사용자 지적이 제기됐다. 사용자들은 ‘수집된 메시지 정보가 신규 서비스 개발 및 마케팅, 광고에 활용될 수 있다’는 표현만 두고는 본인들의 대화가 이루다 개발에 쓰일 것이라 짐작하기 어렵다고 주장한다. 스캐터랩 측은 “개인정보의 수집·이용에 동의를 받는 방법은 국내외 서비스들이 채택하고 있는 것과 동일한 방법으로, 내부적으로나 법적으로 문제가 없을 것이라고 판단했다”며 사과했지만, 한국인터넷진흥원(KISA)과 개인정보보호위원회는 개인정보 유출 관련 조사에 나섰다.
개인정보 유출 논란이 거세지자 스캐터랩은 이루다 개발에 사용된 데이터베이스(DB) 및 이루다의 학습에 사용된 딥러닝 대화 모델을 폐기하기로 결정했다. 연애의 과학과 텍스트앳 앱에서 이용자의 동의를 받고 수집된 기존 데이터는 데이터 활용을 원하지 않는 사용자로부터 신청을 받은 후, 해당 이용자의 데이터를 모두 삭제할 예정이다. 스캐터랩 측은 “이루다 DB는 비식별화(익명화) 절차를 거쳐 개별적·독립적인 문장으로 이뤄져 있고, 딥러닝 대화 모델은 대화 패턴만 학습하기 때문에 개인정보 유출에 대한 위험은 전혀 없다”면서도 “이용자들의 불안감을 고려해 폐기를 결정했다”고 말했다.
◇전문가들 “AI 윤리 논의 시작해야”
전문가들 사이에서는 이번 이루다 사태를 계기로 AI 윤리에 관한 논의를 본격화해야 한다는 목소리가 커지고 있다. AI의 차별과 혐오는 어떤 데이터를 기반으로 학습하느냐에서 비롯되는 만큼 편향된 정보가 입력되지 않도록 보완 장치를 마련해야 한다는 것이다.
다음 창업자인 이재웅 전 쏘카 대표는 지난 12일 올린 페이스북 글에서 “(이번 기회를 통해) AI를 공공에 서비스할 때의 사회적 책임, 윤리에 대해 다시 생각해보고 여러 가지를 재점검하는 기회가 됐으면 한다”며 “이런 문제가 회사 지배구조의 다양성 부족이나 회사 구성원의 젠더·인권감수성의 부족에서 온 것은 아닌지 한 번 더 점검하고 보완했으면 좋겠다”고 말했다.
고학수 한국인공지능법학회장(서울대 로스쿨 교수)은 문화일보와의 통화에서 “일각에서 법을 만들어 보완해야 한다며 ‘금기어’ 설정 등을 이야기하는데 금기어를 무한정 선정할 수 있는 것도 아닌 만큼 법을 통해 이 문제를 해결하는 것은 불가능하다고 생각한다”고 지적했다. 이어 “이루다 사태는 어찌 보면 3차 산업과 4차 산업혁명 차이에서 발생하는 문제와 비슷한데 나사못은 설계를 잘못하면 아예 기능을 못 하지만 AI는 잘못된 데이터가 들어가도 좋지 않은 상태로 작동한다”며 “법을 통해 ‘되고, 안 되고’를 일률적으로 정하기보다는 양질의 데이터를 중심으로 학습할 수 있는 시스템을 갖추도록 지금부터 지혜를 모아가는 것이 중요하다”고 말했다.
AI 윤리 문제는 해외에서도 이미 여러 차례 논란을 일으킨 바 있다. 실제 마이크로소프트(MS)는 지난 2016년 AI 챗봇 ‘테이’를 출시했다가 16시간 만에 운영을 중단했다. 테이가 이용자들과의 대화에서 학습한 내용을 기반으로 “대량학살을 지지한다” 등 각종 차별 발언과 비속어를 쏟아냈기 때문이다. 당시 백인 우월주의자 등은 인간과의 대화를 통해 학습하고 이를 대화에 반영하는 AI 챗봇의 특성을 겨냥, 테이에 비속어와 인종·성차별 발언을 되풀이해 학습시킨 것으로 확인됐다.
2018년에는 아마존이 내부 채용을 위한 AI를 개발했다가 성차별 논란에 휩싸이기도 했다. 회사 내부 고용 패턴을 학습시킨 AI가 채용 과정에서 여성을 배제하는 오류를 일으킨 것이다.
미국 국립표준기술원(NIST)이 2019년 MS 제품을 포함해 189개 안면인식 AI를 분석한 결과, 흑인 및 아시아계에 대한 오류 비율이 백인보다 10∼100배가량으로 높은 것으로 집계됐다. 또한 AI는 여성을 잘 식별하지 못했고, 노년의 얼굴을 잘못 인식할 확률도 중년 대비 10배에 달했다. 시민단체 미국시민자유연합은 “이런 사건은 안면인식 기술이 얼마나 인종차별적이고 인권을 침해할 수 있는지 보여준다”며 정부기관이 안면인식 AI 사용을 전면 중단해야 한다고 촉구했다.
◇정부, 대책마련 나섰지만 업계 우려
정부는 이루다 논란과 관련해 AI 윤리규범을 구체화하는 작업에 나섰다. 방송통신위원회는 지난 14일 “사업자와 이용자, 정부 등 지능정보사회 구성원 모두가 AI 윤리의 중요성을 인지하고 실천 방안을 모색해야 하는 상황”이라며 AI 윤리규범과 관련한 제도 개선에 나선다고 밝혔다. 이에 앞서 지난 13일에는 산업통상자원부와 과학기술정보통신부가 AI 윤리기준 및 법제 로드맵 등 국내 논의를 토대로 AI, 데이터 등 디지털 정책 어젠다에 선제 대응해 글로벌 신질서를 주도한다는 내용을 담은 ‘K-뉴딜 글로벌화 전략’을 발표하기도 했다.
국회에서도 이루다 사태 재발 방지를 위한 법안 논의가 필요하다는 목소리가 나오고 있다. 김태년 더불어민주당 원내대표는 최근 “데이터 산업을 활성화하는 한편 개인정보를 안전하게 보호하는 토대를 구축해야 한다”고 말했다.
업계에서는 이루다 논란에 대한 정부와 국회 차원의 대응이 중복되고 때늦은 대처라는 비판이 나온다. AI 윤리와 관련한 기준이 마련돼야 하는 것은 맞지만, 법과 규제라는 낡은 방식만으로는 AI 분야뿐 아니라 빠르게 진화하는 신산업 분야의 속도를 따라잡을 수 없다는 지적이다. 신산업 발전을 막을 족쇄로 작용할 수 있다는 우려도 제기된다. 업계 관계자는 “유럽연합(EU)의 개인정보보호법(GDPR) 시행에 맞춰 국내법도 이미 재정비했어야 한다”면서 “방통위가 밝힌 내용은 과기부가 지난해 12월에 밝혔던 내용과 유사한데, 정부부처별 방침이 중복된다면 법을 지켜야 하는 기업들 입장에서는 혼란이 불가피하다”고 말했다.
이승주·장병철·이정민 기자
주요뉴스
시리즈
이슈NOW
기사 추천
- 추천해요 0
- 좋아요 0
- 감동이에요 0
- 화나요 0
- 슬퍼요 0