Twitter используется для обозначения счастья в Нью-Йорке


Центральный парк – самое счастливое место в Нью-Йорке, согласно исследованию, в котором было классифицировано более шестисот тысяч твитов, чтобы сопоставить настроение людей с их временем и местоположением.

Исследователи из Института сложных систем Новой Англии (NECSI) использовали данные Twitter для создания карты настроений Нью-Йорка, которая обеспечивает чувствительный ко времени и географически конкретный анализ общественного настроения. Данные показали, что общественное настроение, как правило, выше всего в общественных парках и ниже всего в транспортных узлах.

В течение двух недель в апреле 2012 года исследовательская группа, возглавляемая профессором Яниром Бар-Ямом, президентом-основателем NECSI, собрала через API Twitter 603 954 твита, ограничиваясь теми, которые были помечены геокоординатами вокруг пригорода Нью-Йорка.

Используя твиты, содержащие следующие смайлы, исследователи построили два классификатора для положительных и отрицательных твитов. То есть наличие смайлика использовалось, чтобы определить, был ли твит положительным или отрицательным, и они были использованы для создания классификаторов с использованием текста. Затем классификаторы могут классифицировать твиты, в которых нет смайликов.

Затем для каждого твита в полном наборе были удалены URL-адреса и имена пользователей, текст был токенизирован и ему была присвоена оценка тональности на основе классификаторов. Комбинирование рейтингов настроений с геотегами привело к созданию карты настроений общественности для мегаполиса Нью-Йорка, в которой голубой цвет представляет наиболее позитивные настроения, а пурпурный – наиболее негативные. Белым цветом обозначены области с недостаточной плотностью твитов для анализа.

(щелкните, чтобы увеличить версию)

Пространственный анализ твитов показывает, что настроение постепенно улучшается по мере приближения к Таймс-сквер:

Периодические модели настроений также были выявлены с колебаниями как в дневном, так и в недельном масштабе: по выходным публикуется больше положительных твитов, чем в будние дни, с дневным пиком настроений около полуночи и минимальной точкой между 9:00 и полуднем:

Благодаря использованию геотегов исследователи смогли найти определенные области, вызывающие крайние настроения – помимо парков и транспортных узлов, они включали кладбища, медицинские центры, тюрьму и канализацию. В той части карты, которая показывает Манхэттен, Центральный парк (A1) и Хайленд-парк (A9) выделяются как положительные; Пенн-Сэйшн (B4) и Бруклинский мост (B7) отрицательны, как и остров Райкера (D1), главный тюремный комплекс Нью-Йорка. В отчете также отмечается:

«Один из районов с явно негативными настроениями – это Маспет-Крик в Бруклине (E1). Хотя его географические особенности ничем не примечательны, этот район является одним из самых загрязненных городских водоемов в стране».

и он содержит графические детали об этом участке, так что вы, вероятно, представите запах ила и неочищенных сточных вод.

Отчет завершается комментарием о преимуществах этого упражнения по интеллектуальному анализу данных:

«Наш метод анализа общественного настроения имеет несколько сильных сторон. Используя множество данных Twitter с геотегами, мы можем получить пространственную информацию, которая является как обширной, так и точной. Краткость твитов позволяет быстро обрабатывать и классифицировать их, а их частоту создает своевременную картину общественного мнения ».

Это умная методология, которая дает результаты, которые соответствуют здравому смыслу: парки – это хорошее место, а канализация – это плохо.


Добавить комментарий