■ 이현우의 Deep Read - 선거와 여론조사
낮은 응답률·표본 대표성·응답 편중 등 문제투성이… 여론조사는 선거예측조사 될 수 없어
美, ‘2016 힐러리 승리’ 오보 이후 자성… 韓은 조사-실제 크게 달라도 자극적 보도 계속
여론은 정치를 움직인다. 여론이 중요한 만큼 여론을 측정하는 여론조사는 정확해야 한다. 하지만 여론조사는 많은 한계에 부딪히고 있다. 낮은 응답률과 조사 표본의 대표성 훼손, 응답 편중을 시정할 방법이 마땅치 않다. 선거여론조사는 선거예측 조사가 될 수 없다. 언론은 조사 결과를 신중하게 해석하고 보도하는 태도를 가져야 한다.
◇여론조사와 선거지형
선거여론조사는 민심의 흐름을 보여주는 지표로만 제한돼야 하는데, 실제로는 선거지형 자체를 규정하는 역할을 하고 있다. 조사 결과에 대한 무비판적 신뢰가 선거 승리라는 선거 공학의 논리를 강화한다.
여론조사는 전화면접과 ARS 두 가지 방식으로 수행된다. 전국 단위 조사에서 면접원이 직접 설문을 진행하는 전화면접의 응답률은 15% 내외다. 녹음된 음성에 따라 전화기 패드의 번호를 누르는 ARS 방식은 통상 10% 미만이다. 설문 협조자는 거부자들에 비해 정치에 관심이 많고 지지하는 정당이나 후보가 있는 정치 고관여층이다.
문제는 이들 여론조사 설문 표본이 정치에 무관심하거나 부정적 시각을 가진 사람들을 포함하고 있는 전체 유권자를 대표하지 못한다는 점이다. 즉 표본 대표성의 왜곡 문제가 심각하다. 나아가 공표되는 응답률은 전화통화에 성공한 사람들 가운데 설문 협조자의 비율이다. 통화 자체가 되지 않는 사람들은 응답률 계산에서 제외된다. 여기에 응답률 계산의 함정이 있다. 원천적으로 통화 거부를 택한 사람들까지 포함한다면 실제 응답률은 현재 발표되는 것보다 훨씬 낮아진다.
여론조사의 오류는 선거 결과와 비교해 확인되곤 한다. 2016년 미국 대선 예측은 가장 유명한 사례 중 하나다. 미국의 선거 전문기관인 ‘538(FiveThirtyEight)’은 선거 당일 아침 민주당 힐러리 클린턴 후보 당선 확률을 71.4%로 예측했다. 뉴욕타임스와 허프포스트도 자체 조사를 통해 클린턴의 승리 확률을 85%와 98%로 발표했다. 실제론 도널드 트럼프의 승리였다.
예측 실패의 가장 중요한 원인은 트럼프에 대한 주 지지층인 저학력 백인들의 설문 참여가 적었기 때문이다. 여론조사기관들이 대선 예측 조사에서 표본을 할당할 때 연령·성별·인종을 고려했지만, 학력 요인을 감안하지 못한 것이 가장 중대한 결함이었다는 사실이 밝혀졌다. 결국 ‘가비지 인 가비지 아웃(garbage in garbage out·GIGO)’이었던 것이다.
◇조사와 실제의 불일치
6·3지방선거를 앞둔 상황에서도 ‘윤석열 탄핵-내란 재판’ 등의 파장으로 보수정당 지지자들이 설문 응답에 소극적일 가능성이 크다. 선거여론조사도 여느 조사처럼 연령·성별·거주지별 할당표에 따라 표본을 구성한다. 그렇지만 여론조사를 신뢰하지 않거나 보수정당을 지지한다고 답하기를 꺼리는 응답자들은 다른 부류보다 설문을 거부할 가능성이 커진다.
이 같은 ‘응답 편중’의 문제를 해결하지 못한다면 외형으로는 유권자 전체 분포와 같은 표본이지만, 실제로는 모집단의 정치 성향과 불일치할 수밖에 없다. 편향된 표본 응답은 편향된 결과를 가져온다. GIGO다. 우리나라 대부분 여론조사기관의 설문조사 기법은 설문 협조 의사의 편향을 보정할 방법을 갖지 못하고 있다.
응답 편중의 문제 외에도 여론조사 결과와 실제 선거 결과가 일치하지 않는 이유는 다양하다. 공직선거법에 따르면 선거일 전 6일부터는 이 기간 내 조사한 결과를 공표할 수 없다. 따라서 이 기간 내에 발생하는 선거 사안과 유권자 투표심리 변화를 확인할 방법이 없다. 또 여론조사는 투표 참여자뿐 아니라 기권자까지 포함하고 있어 실제 결과와의 괴리를 넓힌다.
세대별로 투표율이 다르다는 것도 문제다. 전 국민을 모집단으로 하는 여론조사는 ‘선거인 구성비’에 일치하지만, 이는 ‘투표자 구성비’와 일치하지 않는다. 지난 2022년 6월 지방선거에서 보수적인 60대와 70대의 선거인 구성 비율이 각각 16.5%와 8.7%였으나, 실제 투표자 구성에서는 22.5%와 12.7%를 차지했다. 반면 진보적인 40대는 선거인 구성비가 18.5%였으나 막상 투표자 구성은 16%였다.
설문 결과와 실제 선거 결과가 일치하지 않는 적나라한 사례는 2017년 19대 대선과 2025년 21대 대선에서 공히 발견된다. 두 대선 모두 보수진영 출신의 대통령 탄핵으로 치러진 선거다. 보수정당을 지지하는 유권자들은 선거 관련 조사에 소극적 태도를 보였다. 선거 전 여론조사를 실제 투표 결과와 비교해 보면, 공통적으로 이들 정당 대선후보인 홍준표와 김문수의 지지가 낮게 예측됐던 것을 확인할 수 있다.(도표 참조)
◇언론의 보도 관행
선거여론조사는 선거예측 조사가 될 수 없다. 일부 전문가들은 선거 결과 예측을 위해 조사 결과에 나름의 가중치와 변수들을 감안하는 기법을 이용하면 해결된다고 주장한다. 하지만 현행 선거법에서는 여론조사의 원래 결과를 변형한 선거 예측 모델을 공표하는 것을 금지하고 있다.
이처럼 선거여론조사와 선거 예측은 분명한 차이가 있는데도 언론이 여론조사 결과를 마치 ‘오늘 선거가 치러진다면 얻을 수 있는 선거 결과인 것처럼’ 과장되게 보도하는 것은 큰 문제다. 심지어 오차범위 내에 있어 우열을 가릴 수 없는 결과를 두고 ‘오차범위 내에 앞서고 있다’라고 모순된 표현을 거침없이 사용한다.
최근 언론은 NBS 조사(4월 20~22일)에서 국민의힘의 지지도가 15%로 나타난 것을 집중 보도했다. 실상은 약 두 달 전부터 근소차 지지율 변동이 있었을 따름이다. 그럼에도 급격히 지지도가 낮아진 것처럼 독자들의 오해를 불러일으킨다. 동일 기간에 리얼미터 조사는 30~32%대에서 미세한 등락이 있었다. 전화면접이냐 ARS냐에 따라 지지율 차이가 있지만, 적어도 조사기관 각각의 연속 조사에서는 표본 편차를 벗어나지 않는 범위 내 지지율 등락이 있었다고 독자에게 알려주는 것이 균형 잡힌 보도 내용일 것이다.
미국의 언론도 선거여론조사 결과를 주요 뉴스로 다룬다. 다만 그들은 2016년 예측 실패 이후엔 특히 단일 조사 결과를 ‘팩트’처럼 단정하지 않을 뿐 아니라, 보도 관행을 끊임없이 되묻는 자정 논의를 지속하고 있다. 반면 한국 언론은 조사 결과의 한계를 유념하지 않은 채 매일 새로운 조사의 자극적인 결과를 비중 있게 보도하고 있다.
서강대 석학교수, 전 한국선거학회 회장
■ 용어설명
‘가비지 인 가비지 아웃’은 쓰레기가 입력되면 쓰레기 같은 출력이 나온다는 뜻. 여론조사나 컴퓨터과학·정보통신 분야에서 ‘입력 정보의 품질이 결과의 품질을 좌우한다’는 비유로 인용돼.
‘538’은 미국의 선거예측 전문 사이트. 미국 대통령을 뽑는 선거인단 총수 538명에서 따온 이름. 2008년 대선에서는 오바마의 승리를 예측했지만 2016년 힐러리 압승 예측은 실패로 끝남.
■ 세줄 요약
여론조사와 선거지형: 한국은 선거 여론조사가 선거지형 자체를 규정하고 있어. 조사에 대한 무비판적 신뢰가 선거 승리라는 선거 공학의 논리를 강화. 여론조사의 오류는 ‘가비지 인 가비지 아웃’ 인식을 악화함.
조사와 실제의 불일치: 선거 여론조사는 낮은 응답률과 조사 표본의 대표성 훼손, 응답 편중의 문제점을 안고 있어. 2016년 미국 대선이나 2017·2025 한국 대선은 여론조사와 실제 득표율 간 큰 차이를 노정.
언론의 보도 관행: 선거여론조사는 선거예측 조사가 될 수 없어. 미국은 2016년 예측 실패 이후 보도 관행에 대한 자정 논의를 지속하고 있지만, 한국 언론은 여론조사의 자극적인 결과를 비중 있게 보도하는 중.
주요뉴스
시리즈
이슈NOW
기사 추천
- 추천해요 0
- 좋아요 0
- 감동이에요 0
- 화나요 0
- 슬퍼요 0