API Twitter: как анализировать URL из текста твита, используя заданный список API

Поэтому я работаю с Python и Twitter API, используя Tweepy и Twitter Stream API, который возвращает объекты Tweet в режиме реального времени. Часть моего приложения, которая запрашивает другой API, плохо сочетается с URL-адресами в тексте твита, поэтому я использую Python re модуль для замены их безобидной строкой идентификатора. Однако у меня возникают проблемы с поиском URL-адресов, которые необходимо проанализировать из текста. Вместо того, чтобы самостоятельно искать в тексте URL-адреса, я решил использовать те, которые предоставляет API, и выполнить "поиск и замену" в тексте.

Вот документация о том, что API дает мне. Он дает URL-адрес t.co, отображаемый URL и полностью расширенный URL. Проблема только с использованием URL-адреса t.co заключается в том, что twiter не преобразует автоматически все URL-адреса в твитах в t.co, а только те, которые имеют определенную длину. Это означает, что URL t.co не всегда совпадает с тем, который появляется в тексте твита.

Поэтому мне нужно выяснить, как получить из API версию URL, которая фактически отображается в тексте твита.

Спасибо! evamvid

1 ответ

Попробуйте использовать это для extended_url:

tweet_url = str(tweet.expanded_url) # you might not need str(), 
#test it yourself if you'd like.

# Replace tweet by the loop/function you have the json extracted with

tweet_url = tweet_url.replace('\\', '')

print(tweet_url)

Это вы должны дать вам ссылку, не так, как вы этого хотите.

Другие вопросы по тегам