Python читает текст pdf с онлайн-сайта
До сих пор у меня был большой успех, беря текст из загруженного pdf через:
import fitz
with fitz.open("XYZ.pdf") as doc: text = "" for page in doc: text += page.getText()
Я хочу пропустить этап сохранения, кто-нибудь знает, как я могу прочитать текст с онлайн-сайта, пожалуйста?
Я пробовал использовать нижеприведенное на BeautifulSoup, но из-за неправильного формата я предполагаю, что он не читает