Об интеллектуальном анализе данных с использованием данных Twitter
Я планирую написать тезис об использовании информации о настроениях, чтобы повысить предсказуемость некоторых финансовых моделей торговли валютой.
Данные о настроениях должны быть в темах твиттера, включая ключевое слово, например "EUR.USD". И я отфильтрую некоторые сентиментальные слова, чтобы определить их. Простая идея Затем мы попытаемся выяснить, существует ли здесь какая-либо связь между степенью настроения и движением EUR.USD.
Мое большое беспокойство связано с данными в твиттере. Как мы все знаем, твиттер установил лимит для просмотра данных истории. Вы можете просматривать браузер только в течение 5 дней. Это недостаточно, так как наша стратегия основана на ежедневных настроениях.
Я заметил, что у Google есть какая-то фантастическая вещь, например, график времени для обновлений в Твиттере: http://www.readwriteweb.com/archives/googles_twitter_timeline_lets_you_explore_the_past.php
Но прежде всего я нахожусь в Швейцарии и, кажется, у меня нет такой функции в моем Google, которая слишком умна, чтобы определить мое местоположение, и может заблокировать некоторые функции версии Google в США, подобные этой. Во-вторых, даже я мог видеть какой-то необычный интерактивный элемент управления временной шкалой Google на моем Firefox. Как я мог вытащить данные из моего запроса и сохранить их? Google предоставляет такой API?
1 ответ
Служба Google, которую вы упомянули, недавно была закрыта, поэтому вы не сможете ее использовать. ( http://www.searchenginejournal.com/google-realtime-shuts-down-as-twitter-deal-expires/31007/)
Если вам нужен более длинный промежуток времени для анализа, я вижу следующие варианты:
- платить за исторические данные:) ( https://dev.twitter.com/docs/twitter-data-providers)
- если вы не хотите платить, вам нужно получить твиты, содержащие EUR/USD, что угодно (вы можете использовать потоковый API для этого) и как-то их сохранить. Запустите этот сервис на некоторое время (если это возможно), и у вас будет более 5 дней данных.