Компьютерная наука о прогнозировании – кто выиграет Оскар


Дэвид Ротшильд из Microsoft Research в Нью-Йорке, который работал над осознанием ценности больших данных, обратил свое внимание на церемонию вручения премии «Оскар» 2013 года, используя мудрость толпы.

В прошлом году Ротшильд использовал модель на основе данных для прогнозирования результатов президентских выборов в США и оказался верным в 50 из 51 юрисдикции. Теперь он сделал прогнозы для всех 24 категорий 85-й ежегодной премии Академии кинематографических искусств и ученых – Оскара.
Вы можете просматривать прогнозы на PredictWise, сайте, поддерживаемом Дэвидом Ротшильдом и Эндрю Леонардом, который собирает, анализирует и создает прогнозы по политике, спорту, финансам и развлечениям.
Те же данные в реальном времени также используются в приложении Excel, которое доступно для бесплатной загрузки.

Предсказания Ротшильда совпадают с прогнозами других ученых мужей, но его прогнозы более радикальны:

(щелкните в таблице, чтобы увеличить)

Так как же пришли к этим предсказаниям?
Ответ заключается в методологии, которая позволяет исследователям:
быстро и многократно объединяйте ожидания людей для создания прогнозов, которые, как было эмпирически доказано, являются более точными, чем традиционные методы опроса или доступные рынки прогнозов.
Сайт PredictWise собирает данные для решения конкретной проблемы с Оскаром, а именно, как взаимодействуют категории.
Как пишет Ротшильд в своем блоге:
Если Линкольн получает Оскар за лучший адаптированный сценарий, увеличивает ли это вероятность получения Линкольна за лучший фильм, или нет никакой корреляции?
Далее он объясняет, что положительная корреляция означает, что фильм, выигравший в более ранних категориях, выиграет в более поздних, давая множество наград тому, какой фильм выиграл лучший фильм, с другой стороны, отрицательная корреляция – это когда избиратели хотят разделить свои голоса между разными категориями. так что фильмы, выигравшие более ранние категории, с меньшей вероятностью выиграют более поздние.
Например, в самой экстремальной ситуации предположите, что избиратели, такие как Арго и Линкольн, хотят, чтобы они оба одержали победу. Любой избиратель, голосующий за Арго (Линкольн) за лучший адаптированный сценарий, проголосует за Линкольна (Арго) за лучший фильм. Таким образом, если Арго (Линкольн) выиграет лучший адаптированный сценарий, очень вероятно, что другой выиграет лучший фильм.

Это делает задачу прогнозирования всех 24 категорий Оскара сложной задачей, Ротшильд противопоставляет ситуацию президентским выборам, где он имел почти стопроцентную точность:
В политике мы предполагаем очень высокую положительную корреляцию, особенно в последние месяцы кампании. Национальные тенденции перемещают штаты вверх или вниз как пачку, а не штаты, которые независимо переходят от одного кандидата к другому.
Но ответ не так ясен для Оскара, где у меня нет исторических данных, чтобы ответить на этот вопрос сколько-нибудь значимо.
Чтобы получить больше данных, на PredictWise есть игра, в которой посетители могут голосовать за результаты Оскара и в то же время предоставлять данные, которые ценны для улучшения прогнозных возможностей модели PredictWise.


Добавить комментарий