오스카상이 어떻게 생각할 것보다 더 예측할 수 있는지

이번 주, 영화 제작의 주요 인물 대부분이 할리우드에 모여 89th 연례 아카데미 시상식. 몇 가지를 보시고 은행에 갈 수 있습니다. 고통스러운 Inane Red Carpet 인터뷰여러 수락 연설 촉구 일부 평평한 농담. 어쩌면 밤에 한 가지 확실성이 더해질 것입니다. 앞으로 수년간 의문을 갖게 될 것이다..

인종 관계 멜로 드라마가 시작된 지 10 년이 넘었습니다. Crash 찔린 브로크 백 마운틴 2006 Best Picture 상을 수상했으며 여전히 대부분의 목록을 역사에서 가장 명백한 선택 중 하나. 그러나 때로는 커브 볼에도 불구하고 오스카는 실제로 예측할 수 있습니다. 올바른 장소에서 정보를 찾으면됩니다.

너는 너무나 예측 가능하다.

상을받을 사람을 알고 싶다면 마권업자가 최선의 방법입니다. 특히 늦게 맡기는 것이 좋습니다. 행사가 끝나기 전까지 (골든 글로브, BAFTAs 및 스크린 배우 길드 상 이후 가버 리고 떠났을 때) 도박 대행사는 일반적으로 아카데미가 누구를 인정할지를 잘 알고 있습니다.

예를 들어, 2004 이후, 마권업자는 '2009, 숀 펜은 좁은 둘째로 좋아했지만 밀크에서 우승했습니다..) 같은 기간에 두 명의 여배우가 오스카상에 출전하지 못했고 두 수상자 모두 두 번째로 좋아했습니다.

실제로 6 가지 주요 카테고리, 즉 베스트 이미지, 베스트 디렉터, 최우수 남우주 연상, 최우수 여우 조연상, 최우수 조연 남우주 연상, 최우수 조연 여우 조연상 등으로 돌아 가야합니다. 즐겨 찾기 또는 두 번째 즐겨 찾기로 수상하지 못한 마지막 시간을 찾기 위해 전체 9 년.


내면의 구독 그래픽


아카데미가 예측할 수없는 결정을 내린다는 인식의 상당 부분은 그 당시의 대중의 의견을 잊어 버린 사람들입니다. 전설적인 2006에서의 크래시 승리를 되돌아 보면, 실제로 여전히 두 번째로 좋아하는. 의식 이전의 날에는 엄청난 A $ 9에서 A $ 2.50로 바뀔 가능성이있는 대중의 눈에도 많은 기세가있었습니다.

이 효과는 아래 차트에서 볼 수 있습니다. 데이터는 매년 가능한 한 시상식에 가깝게 다양한 출처에서 수집되었습니다. 2004 이후 여섯 가지 주요 카테고리에 걸쳐 82 % 이상의 상금이 장부 좋아하는 사람에게 돌아갔습니다. 레드 핫 (A $ 1.20 또는 그 이하) 즐겨 찾기가있을 때, 상금은 더욱 예측 가능합니다. 지난 13 년 동안, 그런 인기가 많은 후보자는이 카테고리 중 하나에서 수상하지 못했습니다.

이것은 예측 가능성이 뛰어납니다. 호주의 주요 스포츠 협회를 살펴보면 A $ 1.20 또는 그 이하의 대회와도 경쟁이 훨씬 더 불확실합니다. 지난 4 년 동안 AFL 게임 중 11 %가 AFL 게임의 붕괴로 끝났습니다. NRL에서 비율은 거의 28 %로 훨씬 높습니다. 이런 맥락에서 오스카상은 상대적으로 확실한 것 같습니다.

오스카상은 6,000 투표 회원 중 17 분과 의원이 선택합니다 영화 및 과학 아카데미. 왜 그렇게 예측 가능합니까? 장부는 사람들이 여론을 걸고있는 여론으로부터 그들의 확률을 끌어 낸다. 아마 오스카상은 너무 확실합니다. 이전 상, 또는 사람들은 더 넓은 여론을 잘 느끼고 있습니다. 아마도 또한 좋은 구식이 있습니다. 오스카 투표자 유권자 승률에 영향을 미친다.

다음 계산을 통해 마권업자가 지명 된 사람을 평가할 가능성이 얼마나되는지 대략 알아낼 수 있습니다 : A $ 1 / 확률 x 100 %. 예를 들어, A $ 2.50의 확률로 2006 Best Picture Crash는 40 %의 성공 가능성이 있다고 생각되었습니다.

이 데이터 세트의 기간 동안 가장 큰 화가는 Tilda Swinton의 Best Supporting Actress가 2008에서 우승 한 것입니다 마이클 클레이튼. 저술가들은 10 %의 확률로 A $ 11로 확률을 얻었습니다.

왜 다른 모든 사람들이 잘못 받아들이는지

오스카상의 예측 가능성에 대해 더욱 놀라운 점은 일을 끝내고 잘못 이해하는 사람들의 수입니다.

작년 Nate Silver의 데이터 과학 사이트 인 FiveThirtyEight는 9 가지 다른 수학적 모델 오스카 수상자들의 예상을 이끌어 내기 위해 이용 가능한 데이터를 수집했다.

이 모델 중 일부는 아마추어 데이터 과학자 (비록 박사 학위를 가진 아마추어 or 하버드 학위와) 및 기타 Ernst 및 Young 팀과 Simulation을 통한 예측 분석 작업 솔루션, FiveThirtyEight 자체 팀과 같은 전문가가 참여했습니다.

각 모델은 서로 다른 데이터 세트를 사용했습니다 - 일부는 트위터 멘토, 다른 것은 박스 오피스 성능 및 다른 사람들은 역사적 수상자 또는 최근 영화 리뷰의 주제에서 사용했습니다.

그렇다면이 수학적 모델은 어떻게 ...? 전반적으로, 그들의 성과는 비참한 것으로 묘사 될 수 있습니다. 주요 6 가지 범주에 걸쳐 이루어진 48 예측 이 중 50 % 만 정확했습니다.. 그들 중 일부는 다음과 같은 절대적인 확실성을 놓쳤다. 레오나르도 디카프리오 (A $ 1.01 또는 99 %) 브리 라슨 (A $ 1.04 또는 96 %).

왜이 모델들은 그렇게 저조한 실적을 냈습니까? 너는 아마 그 용어를 들었을거야. "빅 데이터" 그 아이디어는 거대한 데이터 세트는 우리가 미래를 예측할 수있는 패턴을 검색 할 수 있습니다.. 이런 맥락에서 '큰'의미가 무엇인지 정의 할 수있는 사람은 아무도 없지만 오스카 데이터 세트는 확실히 크지 않습니다.

1 세기도 안되는 기간 당 1 카테고리 당 1 데이터 포인트는 시스템의 다른 임의성 또는 예측 불가능 성을 극복하지 않습니다. 예를 들어, 오스카 유권자의 취향에는 종종 단기적인 경향이 있습니다.

. 1960s, 네 뮤지컬 Best Picture 우승. 그만큼 1980는 식민주의와 그 여파를 다루는 영화를 선호하는 것 같았다.. 밀레니엄 시대를 맞이하여 아카데미는 안전하고 논쟁의 여지가없는 박스 오피스 찬사를 보냈다. 그러나 수학적 모델을 교정 할 때부터 인기있는 추세가 모델에 영향을 줄 때까지 이미 맛은 계속 나아 갔을 것입니다.

스포일러 경고

올해 주요 6 개 부문에서 5 개의 저렴한 (A $ 1.20 이하) 즐겨 찾기. 위에서 보았 듯이, 10 년이 넘는 시간 동안 좋은 결과를 얻지 못했습니다.

역사가 반복된다면, 캐스팅과 승무원이 라 라 랜드 그들의 벽난로를 위해 조금 더 많은 금을 들고 Hollywood Boulevard에서 건너 뛰고 돌고 춤을 추을 수도 있습니다. 여배우 엠마 스톤 (Emma Stone)과 감독 인 데미안 샤젤 (Damien Chazelle)은 모두 그 성공을 위해 엄청나게 팁을 받았습니다.

비슷하게, Mahershala 알리는에서 배우를지지했다. 월광, 그리고 여배우를위한 비올라 데이비스 (Viola Davis) 울타리 자신감을 느끼는 모든 이유가있는 것처럼 보입니다. 북 메이커에 따르면, 올해의 최고 배우 경주 만이 예측하기 어려워 야합니다. Casey Affleck의 성과 바다로 맨체스터 A $ 1.57에서 Denzel Washington보다 겨우 앞서 있습니다.

그러나 확률이 밤까지 이어질 수 있다는 것을 기억하십시오. 2006 행사가 있기 일주일 전에 브로크 백 마운틴 (Brokeback Mountain) 주변의 오랜 신뢰가 무너지기 시작했고 거의 A $ 1.10에서 A $ 1.50로 바뀌었다. 뒤늦은 시야에서 성공에 대한 의심이 옳았다는 것이 입증되었습니다.대화

저자에 관하여

Stephen Woodcock, 수학 수석 강사, University of Technology 시드니

이 기사는 원래에 게시되었습니다. 대화. 읽기 원래 기사.

관련 서적

at 이너셀프 마켓과 아마존