상단영역

본문영역

데이터 과학자가 예측한 美 대선 결과

토마스 밀러는 2020년 선거에서 조지아주를 제외한 모든 주의 결과를 맞춰 이번에도 관심을 집중시킨다.

  • 슬롯사이트 소닉 메이저입력 2024.09.19 10:20
  • 최종수정 2024.09.19 16:22
  • 기자명Shawn Tully & 김나윤 기자
[사진=셔터스톡]
[사진=셔터스톡]

2020년 말부터 2021년 초까지 토마스 밀러 노스웨스턴대데이터 과학자가 제시한 독특한 선거 예측 모델에 관심이 쏠렸다. 밀러는 당시 대선과 조지아주 상원의원 선거 결과를 정확히 예측하며 주목받았는데, 특히 조지아주 상원의원 선거에서 민주당의 의외의 승리를 예측한 점은 인상적이었다.

이번에도 밀러는 자신만의 독창적인 방법론을 활용하여 48일 후에 결정될 대선 결과를 예측하고 나섰다. 밀러가4년 전에 정확한 예측을 해낸 이력이있기 때문에, 이번 예상에 대한 관심이높아지고 있다. 비록 그의 예측이 기존의 여론조사 결과와는 다르게 나타나 많은 이들을 놀라게 할 수 있지만, 데이터 과학자의 분석 결과라는 점에서 고려해 볼 만한 가치가 있다.

2020년 세 차례의 선거에서 밀러는 바이든의 선거인단 승리 규모를 단 12표 차이로 예측했고, 조지아주를 제외한 모든 주의 결과를 맞췄다. 두 번의 상원의원 결선투표에서 밀러는 조지아주 데이터 분류 방식을 개선해 정확한 예측을 해냈다. 2020년 12월 6일 선거일 일주일 전, 여론조사에서는 공화당의 데이비드 퍼듀가 민주당의 존 오소프를 크게 앞서고 있었고, 공화당의 켈리 뢰플러와 민주당의 라파엘 워녹이 팽팽한 접전을 벌이고 있는 것으로 나타났다. 반면 밀러의 수치는 뢰플러가 큰 패배를 당할 것이며, 오소프가 근소한 차이로 승리할 것이라고 예측했다. 선거 결과 밀러는 워녹의 2.0% 승리 마진을 단 0.2%포인트 차이로 예측했고, 오소프의 최종 1.0% 득표율 우위를 맞췄다.

밀러는 여론조사가 아닌 내기 판돈을 바탕으로 예측한다는 점에서 기존 방식과 다르다.

그는 포춘인터뷰에서 "정치 사건 내슬롯사이트 소닉 메이저이트가 군중의 지혜를 예측하는 데 가장 뛰어나다"고 말했다. 여론조사가 과거를 알려주는 반면, 베팅 사이트의 배당률은 미래를 보여준다고 주장했다. 그는 "여론조사는 과거의 스냅샷"이라고 지적했다. 이어"일반적으로 500~1500명의 소규모 표본을 조사한다. 그리고 여론조사원들은 응답자들에게 그 순간 누구에게 투표할 계획인지 물어보는데, 결과가 발표될 때쯤이면 며칠 후 변했을 수 있다. 대부분의 여론조사는 4~5일 정도 뒤처진다"고 설명했다.

밀러는 이같은 지연이 실제 상황을 왜곡하는 많은 노이즈나 변동성을 야기한다고 말한다. 또한밀러는 "어떤 후보에게 투표하시겠습니까?"라는 질문보다 "어떤 후보가 이길 것으로 예상하십니까?"라는 질문이 더 적절하다고 본다.

2020년 바이든-트럼프 대결에서 밀러는 미국 최대 정치 내슬롯사이트 소닉 메이저이트인 프레딕잇에 게시된 가격을 활용했다. 56개 개별 투표 관할구의 프레딕잇 배당률을 가져와 시간별 변화를 추적했고, 자체 모델을 사용해 이 데이터를 매우 최신의 일일 배당률로 집계했다. 사람들이 24시간 내내 사이트에서 한 후보나 다른 후보에 베팅을 하고 있었기 때문이다. 상원 선거의 경우 밀러는 다른 접근 방식을 취했다. 약 1200명의 조지아주 주민들로 구성된 실험자를모집했는데, 조사참여에 대한 소액의 보상과 함께 승리 가능성이 가장 높은 정치인 후보를 맞히면 추가 보상을 제공하기로 약속했다. 이때 반드시 투표하려는 후보가 아니라 승리할 것 같은 후보와 승리 마진을 예측하도록 했다. 여론조사와 내기시장의 장점을 결합한 방법은밀러가 거의 완벽하게 득표율을 예측할 수 있게 도와줬다.

2024년 대선에서도 밀러는 다시 프레딕잇에 의존하고 있다. 이 사이트가 "여론조사원들이 선별한 집단보다 더 안정적인 투자자 그룹을 보유하고 있다"고 평가한다. 그는 "하루 종일 수만 명이 사이트에서 베팅을 하고 있다"며 "최대 계약 금액은 850달러이고, 평균적으로 매일 37,000개의 '주식'이 거래된다"고 설명했다. 간단히 말해, 밀러는 프레딕잇을 수많은 매수자와 매도자가 모이는 소형주나 고수익 채권 거래소와 유사한 매우 유동적인 시장으로 보고 있다. 밀러는 "금융 시장은 미래 지향적이며 정보를 즉각적으로 반영하는데, 프레딕잇도 같은 이점을 제공한다"고 말한다.

밀러는 바이든-트럼프 재대결을 평가하기 위해 1960년부터 시작된 가장 최근 16번의 대선 결과를 바탕으로 '일반화된 선형 모델'을 개발했다. 그해 케네디-닉슨 대결 이후 모든 대선은 538명의 선거인단 투표로 결정됐다. 그는 "이 모델은 많은 역사적 데이터를 기반으로 한다"고 설명한다. 이 모델은 프레딕잇의 일일 가격이 각 후보에 대한 유권자 지지율과 밀접하게 연관되어 있음을 보여준다. 예를 들어 어느 날 내기참여자들이 후보 A에게 52센트, 즉 52%의 승리 확률을 부여했다면, 밀러의 계산에 따르면 그 시점에서 유권자의 52%가 후보 A에게 투표할 계획이라고 예측할 수 있다.

밀러는 매일 자정에 내기관련 정보를그래프에 기록하고, 그 위에 선거에 영향을 미치는 주요 사건들을 겹쳐 표시했다. 그래프 이름은 '현재 상황과 선거 운동 사건이 예측 선거인단 투표에 미치는 영향'이라고 붙였다.그래프는밀러의 웹사이트 '버추얼 타우트'에 게시됐다. 전체적으로 그래프는프레딕잇 배당률이 보여주는 선거인단 투표 수를 추적한다. 그래프는 거대한 'U'자 모양으로, 가파른 스키 슬로프가 바닥을 찍고 다시 거대한 산으로 올라가는 형태를 띠고 있다.

그래프에 따르면 바이든-트럼프 토론 이전에 공화당 후보가 앞서고 있었다. 밀러의 차트에서 트럼프는 스키 슬로프 정상에 서 있었다. 6월 중순 트럼프는 538명의 선거인단 중 거의 400명을 확보할 것으로 보였다. 6월 27일 TV 토론 이후 트럼프의 우세는 더욱 강화되었고, 공화당 전당대회 기간을 전후해 거의 500명에 육박하는 최고점을 찍었다. 7월 21일 바이든이 사퇴한 후 민주당의 승산이 높아졌고, 8월 6일 해리스가 지명을 확정 지을 무렵에는 민주당이 약 325명의 선거인단을 확보하며 앞서나가기 시작했다. 이후 2주 동안 계속 상승세를 보이다가 8월 22일 전당대회가 끝날 무렵에는 400명까지 올라갔다.

그러나 트럼프가 반격에 나선 모양새다. 9월 10일 트럼프-해리스 토론을 며칠 앞두고 해리스가 여전히 앞서고 있었지만, 트럼프가 거의 따라잡은 상태였다. 밀러는 "그 시점에서 경쟁은 본질적으로 박빙이었다"며 "민주당 예측치는 288명이었다"고 말했다. 필라델피아에서 열린 TV 토론이 78세 전직 대통령에게 결정적인 순간이었다.

밀러의 수치에 따르면 후보들이 토론장을 떠난 지 하루 만에 해리스의 선거인단 득표가 400표를 넘어섰다. 밀러는 토론 당일 유명가수 테일러 스위프트의해리스 지지 선언이 트럼프의 인기를무너뜨리는 데 도움이 됐을 것이라고 분석했다. 그 이후 해리스는 400표 이상을 계속 유지하고 있다.

버추얼 타우트에 게시된두 번째 차트는 지난 16번의 선거에서 득표율이 선거인단 득표에 어떤 영향을 미쳤는지 보여준다. 밀러는 프레딕트잇가격을 득표율과 동일하게 간주한다는 점에 주목해야 한다. 즉, 선거일에 한 후보의 가격이 51%라면 전체 투표의 51%를 얻을 가능성이 높다는 뜻이다. 그는 전통적으로 민주당 후보가 승리하려면 2% 이상의 우위를 확보해야 하고, 공화당 후보는 약 48%만으로도 이길 수 있다고 지적한다.

9월 16일 현재 프레딕트잇은 해리스 55센트, 트럼프 45센트를 보여주고 있다. 이는 바이든이 사퇴하기 전 상황의 정반대다. 밀러의 모델에 따르면 이러한 확률은 민주당 후보가 55%의 득표율을 얻는다는 의미다. 이 상황이 지속된다면 트럼프는 패배 가능성이 높다. 밀러는 "(투표 격차는) 1964년 린든 존슨 대배리 골드워터 선거전의 격차 혹은1996년 빌 클린턴 대밥 돌 선거전 사이어딘가가 될 것"이라며 "해리스가 400표 이상의 선거인단 표를 얻고 미시간, 펜실베이니아, 노스캐롤라이나와 다른 모든 경합주에서 승리하는 압도적인 승리가 될 수 있다"고 전망했다.

밀러는 최근이렇게 극적인 역전은 없었다고 지적한다. 그는 "트럼프의 압도적 승리에서 해리스의 압도적 승리로 바뀌었다"고 설명했했다. 이제 격차가 너무 커서 또 다른 대반전이 있어야만 트럼프가 경쟁력을 회복할 수 있을 것이며, 밀러는 현재 추세가 이어진다면11월 6일 해리스가 승리를 거둘 것으로 예측한다. 마지막으로 그는 존슨 캠페인이 골드워터를 비난하는 데 사용한 슬로건을 언급했다. "당신의 직감은 그가 미쳤다고 말한다."

밀러의 시장 기반 분석에 따르면, 자신의 돈을 걸고 내기하는사람들은 9월 10일 후보들이 토론장을 떠날 때쯤 수백만 명의 유권자들이 전직 대통령 지지를 거두었다고판단했다.

/ 글 Shawn Tully & 슬롯사이트 소닉 메이저 김나윤 기자 abc123@fortunekorea.co.kr

이 슬롯사이트 소닉 메이저를 공유합니다

개의 댓글

댓글 정렬
BEST댓글
BEST 댓글답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음