Как разобрать твиты полученные от твипи по ключевым словам?
Я могу успешно получать потоковые твиты, используя tweepy. Я предоставляю список ключевых слов и хэштегов в фильтре потока, используя:
stream.filter(track=utils.hash_tag_mapping)
где hash_tag_mapping
(список, содержащий более 500 ключевых слов):
[\"old spice\" after hours deodorant, \"old spice\" cologne, \"old spice\" deodorant, braun (oral-b OR oralb), baby wash, ... ]
Теперь, когда я получил твиты, я хочу выбрать ключевые слова, для которых получен твит. Это может содержать несколько ключевых слов.
Например, чирикать текст:
Какая разница, если мы используем старый дезодорант специй вместо дезодоранта после закрытия?
Ключевые слова должны быть извлечены:
- старый специй дезодорант
- старая специя после часа дезодорант
Есть ли способ извлечь ключевые слова, по которым извлекаются твиты?