- 포털사이트 ‘연관 검색어’ 조작

프로그램으로 상호 반복 입력
IP 바꾸며 ‘차단 조치’ 피해
네이버, 알고리즘 개편 착수

“수법 다양하고 진화속도 빨라
시스템 지속 개선外 방법없어”


지난 9월 네이버의 연관 검색어를 조작한 일당이 검찰에 검거됐다. 네이버는 사용자의 검색 편의성을 위해 크게 세 가지의 검색 관련 서비스를 제공한다. 연관 검색어, 실시간 급상승 검색어, 자동완성 등이 대표적으로 연관 검색어는 사용자가 입력한 키워드와 관련해 다시 검색할 가능성이 큰 검색어를 보여주는 서비스다. 물론 네이버는 범행 대상이 된 연관 검색어는 물론, 실시간 급상승 검색어와 자동완성 역시 사용자들의 실제 이용 패턴을 정확하게 반영할 수 있도록 알고리즘을 나날이 진화시키고 있다. 그러나 업계에서는 이를 백신과 바이러스의 관계에 비유한다. 바이러스의 진화속도를 백신이 따라잡기 어렵다는 의미다.

◇연관 검색어 = 네이버에서 ‘광화문 맛집’을 검색하면 초록색 검색 창 아래로 주변 음식점 상호가 뜬다. 지난 10월 30일 오후 3시 기준으로는 ‘광화문 전복구이 파스타’ ‘서촌 준수방키친’ 등이 보인다. 연관 검색어 서비스다.

연관 검색어는 사용자가 검색어를 일일이 입력하지 않아도 입력한 키워드와 관련해 검색할 가능성이 큰 검색어를 보여주는 서비스다. 사용자가 키워드 A를 검색하고 연달아 B를 검색하는 등의 패턴을 분석해 관련 있는 키워드 쌍을 추출한 후 필터를 거쳐 후보군을 생성, 이용자 선호도를 랭킹화해 노출하는 방식이다.

그러나 허점은 있었다. 최근 검찰에 붙잡힌 연관 검색어 조작단은 2014년부터 음식점, 병원, 학원 등으로부터 돈을 받고 이들의 상호를 연관 검색어에 올리는 일을 시작했다.

일당은 특정 상호를 입력하고 작동만 시키면, 자동으로 클릭하거나 상호를 반복해 입력하는 프로그램을 개발했다. 클릭, 입력이 많아질수록 연관 검색어 상위로 올라가 노출되는 연관 검색어의 알고리즘을 악용한 것이다.

네이버 데이터 랩(모바일)을 통해 볼 수 있는 실시간 급상승 검색어 트래킹 화면(왼쪽 사진)과 시간대별 자동완성 기능을 추가한 콘텍스트 자동완성 화면(오른쪽). 네이버 제공
네이버 데이터 랩(모바일)을 통해 볼 수 있는 실시간 급상승 검색어 트래킹 화면(왼쪽 사진)과 시간대별 자동완성 기능을 추가한 콘텍스트 자동완성 화면(오른쪽). 네이버 제공

물론 네이버는 이 같은 조작을 막기 위해 특정 접속 인터넷 주소(IP)에서 클릭 수가 급증하면 IP를 차단한다. 그러나 범인들은 매시간 IP를 바꾸는 프로그램을 통해 네이버의 방패를 우회했다. 업계 관계자는 “외부 공격은 다양하고 그 방식이 여러 가지”라면서 “무한대로 시스템을 진화시켜가는 방법밖에 없다”고 말했다.

이에 따라 네이버는 연관 검색어 알고리즘 개선에 착수한 상태다. 그동안 연관 검색어는 전체 검색 기록을 대상으로 후보군을 생성해왔으나 이 같은 시도에 대응하기 위해 샘플링 후보군을 줄이는 방향이 유력하게 검토되고 있다.

◇실시간 급상승 검색어 = 네이버 메인 화면 바로 오른쪽에 나타나는 실시간 급상승 검색어는 사용자가 입력하는 검색어를 기반으로 매 순간 끊임없이 변화하는 사용자들의 다양한 관심사를 보여주는 서비스다. 최근 논란이 된 ‘고마워요 문재인’ ‘힘내세요 김이수’ 등도 모두 실시간 급상승 검색어였다. 실시간 급상승 검색어는 일정 기간 검색량이 증가한 비율이 높은 검색어 20개를 30초마다 새로 집계해 보여준다.

특히 실시간 급상승 검색어는 평소 검색이 적은 검색어일수록 순위 진입이 쉽고 빨리 순위에서 사라지지 않는 알고리즘으로 운영된다. ‘실시간 급상승’이라는 서비스 취지를 살리기 위해서다.

누적 검색 수가 10에서 100으로 증가한 검색어 ‘A’와, 1000에서 1만으로 증가한 검색어 ‘B’의 상승률은 10으로 같아서 A와 B 모두 실시간 급상승 검색어 순위에 오르지만 누적 검색 수가 높은 검색어 ‘B’는 검색 수가 획기적으로 증가하지 않는 이상, 급상승 순위에서 사라질 가능성이 크다는 의미다.

네이버는 서비스 투명성 확보를 위해 실시간 급상승 검색어 역시 꾸준히 개편해왔다. 지난 1월 진행된 첫 개편에서는 기존 10위까지 제공하던 실시간 급상승 검색어 순위를 20위까지 확대했다. 이는 특정 검색어가 눈앞에서 사라지며 제기되는 ‘조작’ 논란을 불식하기 위한 조치다.

3월 말부터는 네이버 데이터 랩 내에 ‘급상승 트래킹’ 섹션을 추가하고 실시간 급상승 검색어 차트가 어떻게 변화했는지 파악할 수 있도록 히스토리도 제공하고 있다.

◇자동완성 = 자동완성은 사용자가 검색할 때 검색어를 정확히 모르거나 적은 글자를 입력하더라도 원하는 검색 결과를 보다 쉽게 찾을 수 있도록 사용자가 입력할 가능성이 큰 단어를 제공하는 서비스다. ‘점’이라는 단어를 입력하면 ‘점 빼고 난 후 관리’ ‘얼굴 점 빼기’ 등이 검색되는 방식이다.

특히 네이버는 최근 ‘콘텍스트(문맥) 자동완성’ 기능을 도입, 로그인 기반 사용자의 검색 패턴 등 빅데이터 분석 기술을 바탕으로 시간대나 나이 및 성별에 따라 사용자가 속한 그룹의 관심사를 파악해 각기 다른 키워드를 제공하고 있다.

예를 들어 콘텍스트 자동완성 기능을 켠 후 ‘점’이라는 단어를 입력하면 ‘점 빼고 난 후 관리’와 함께 시간대에 따라 ‘점심 메뉴 추천’이 자동 완성 목록에 나타나기도 한다.

네이버 관계자는 “자동완성 및 연관 검색어는 음란용어, 불법범죄 정보와 같은 유해 정보를 차단하고 사생활 침해나 허위사실 유포 등의 피해를 방지하기 위해 2012년부터 외부 기관인 한국인터넷자율정책기구(KISO)의 정책 결정 내용을 기준으로 운영하고 있으며 KISO 검증위원회를 통해 검증을 받고 있다”고 말했다.

임정환 기자 yom724@munhwa.com

관련기사

임정환

기사 추천

  • 추천해요 0
  • 좋아요 0
  • 감동이에요 0
  • 화나요 0
  • 슬퍼요 0