Сокращение количества твитов с географической привязкой

Во время потоковой передачи данных из твиттера я обнаружил очевидное сокращение количества твитов с географической привязкой (твитов с широтой и долготой). Это из-за информационной интеграции Foursquare? Или есть другие проблемы?

Большое спасибо!

1 ответ

В прошлом году я работал над приложением "Социальная аналитика по местоположению". Мы сэмплировали твиты из твиттера с намерением использовать атрибуты геолокации для определения настроения по области. К сожалению, мы обнаружили, что только 10-15% твитов (на основе наших собственных результатов) были фактически геотегированы, что было недостаточно для точного описания настроений. Вместо этого мы выбрали использование хештегов с указанием местоположения.

Говоря, что это зависит от размера выборки. Мы пытались определить настроения в таких областях, как здания, в которых было небольшое количество активных пользователей Twitter. Если ваша цель состоит в том, чтобы найти твиты в гораздо больших областях, таких как города / города / страны, то 10-15%, вероятно, достаточно для ваших нужд.

Чтобы ответить на ваш первоначальный вопрос: пользователи, как правило, являются частными, если они явно не собираются регистрироваться где-либо, и поэтому я предполагаю, что 10-15% твитов с географическим местоположением являются результатом того, что пользователи забывают отключить географическое местоположение или используют новые / редко используемое устройство, где оно не отключено. Это также может быть связано с интеграцией информации о Foursquare, так как я уверен, что пользователи просто упускают из виду тот факт, что Foursquare предоставляет Twitter информацию о геолокации.

Эта статья интересна для чтения. В нем описывается приложение, разработанное университетом SoCal, которое может помочь пользователям определить, передают ли они конфиденциальную / личную информацию о местонахождении в своих твитах.

Другие вопросы по тегам