API Twitter: как анализировать URL из текста твита, используя заданный список API
Поэтому я работаю с Python и Twitter API, используя Tweepy и Twitter Stream API, который возвращает объекты Tweet в режиме реального времени. Часть моего приложения, которая запрашивает другой API, плохо сочетается с URL-адресами в тексте твита, поэтому я использую Python re
модуль для замены их безобидной строкой идентификатора. Однако у меня возникают проблемы с поиском URL-адресов, которые необходимо проанализировать из текста. Вместо того, чтобы самостоятельно искать в тексте URL-адреса, я решил использовать те, которые предоставляет API, и выполнить "поиск и замену" в тексте.
Вот документация о том, что API дает мне. Он дает URL-адрес t.co, отображаемый URL и полностью расширенный URL. Проблема только с использованием URL-адреса t.co заключается в том, что twiter не преобразует автоматически все URL-адреса в твитах в t.co, а только те, которые имеют определенную длину. Это означает, что URL t.co не всегда совпадает с тем, который появляется в тексте твита.
Поэтому мне нужно выяснить, как получить из API версию URL, которая фактически отображается в тексте твита.
Спасибо! evamvid
1 ответ
Попробуйте использовать это для extended_url
:
tweet_url = str(tweet.expanded_url) # you might not need str(),
#test it yourself if you'd like.
# Replace tweet by the loop/function you have the json extracted with
tweet_url = tweet_url.replace('\\', '')
print(tweet_url)
Это вы должны дать вам ссылку, не так, как вы этого хотите.