Описание тега urlopen

Urlopen - это метод библиотеки urllib в Python, используемый для открытия определенного URL-адреса.
1 ответ

Код Python3 для извлечения только одной конкретной строки из исходного кода веб-страницы

В моем коде я использую urlopen, но он извлекает всю веб-страницу. Можно ли получить только один конкретный номер строки исходного кода веб-страницы, чтобы оптимизировать мою программу скажем, например, я хочу напечатать строку номер 135 из исходног…
03 июл '14 в 10:01
1 ответ

Python: сохранить страницу с большим количеством графики в виде файла.html

Я хочу сохранить посещенную страницу на диске в виде файла. Я использую urllib и URLOpener. Я выбираю сайт http://emma-watson.net/. Файл правильно сохраняется в формате.html, но когда я открыл файл, я заметил, что главное изображение сверху, которое…
22 июл '14 в 21:48
2 ответа

Почему python urllib2 urlopen возвращает что-то отличное от браузера при вызове API

Мне нужно регулярно получать и анализировать данные XML с веб-сайта в форме: https://api.website.com/stuff/getCurrentData?security_key=blah Я не могу опубликовать фактические соединения из-за безопасного характера данных. Когда я помещаю этот URL-ад…
31 май '13 в 13:39
2 ответа

Выполните рукопожатие только один раз

Я использую urllib.request.urlopen получать данные с сервера через HTTPS, Функция часто вызывается на один и тот же сервер, часто на один и тот же URL. Однако, в отличие от стандартных веб-браузеров, которые выполняют рукопожатие по первоначальному …
25 янв '16 в 19:38
0 ответов

Ошибка соединения SSL 777 или тайм-аут соединения с использованием urlopen python3.6

У меня есть один URL, который дает мне ответ JSON. Я использую оболочку Python 3.6.3. >>> from urllib.request import urlopen >>> url = "https://test_url.com" >>> urlopen(url) Эта команда дает мне правильные результаты и об…
1 ответ

Mercurial и nginx. Ошибка 10054

Когда я отправляю файлы на сервер, то через 60 секунд я получаю "urlopen error [Errno 10054]". Я думаю, это потому, что я толкаю большие файлы. Я использую веб-сервер nginx с процессом fast-cgi. Какой параметр nginx отвечает за этот тайм-аут 60 секу…
23 июл '11 в 10:44
3 ответа

Урлопен душит меня новыми строками

Я соскребаю простые текстовые файлы с URL. def scrape_contents_ex(url): data = urllib2.urlopen(url) return data.read() Проблема в том, что строка, которую она дает, забита символами новой строки и табуляции "\t", "\r" и т. Д. Пример: Вот веб-страниц…
01 май '16 в 02:30
2 ответа

Как я могу загрузить файл в Python3 с помощью urlopen() или добавить пользовательские заголовки в urlretrieve()?

Я хочу сделать скачать файл с сервера, который позволяет только определенные User-Agents, Мне удалось получить 200 OK с сайта, используя следующий код: opener = urllib.request.build_opener() opener.addheaders = [('User-Agent', 'Interwebs Exploiter 4…
0 ответов

Получение http.client.BadStatusLine с помощью urlopen(IP).read()

Данные, которые я пытаюсь прочитать, представлены в формате xml. Перед объявлением xml есть один пробел. Я не могу редактировать эту часть, так как она жестко запрограммирована в источнике данных. Я могу только читать из него. Когда URL введен в IE,…
28 мар '13 в 19:48
1 ответ

Получение текста ошибки из `urllib2.urlopen`

Я использовал Python urllib2.urlopen и получил ошибку 500 с сервера. Как мне найти текст ошибки? Я надеюсь, что у него есть полезная информация.
26 май '11 в 15:15
3 ответа

Как передать параметр в Url с помощью Python urlopen

В настоящее время я новичок в программировании на Python. Моя проблема в том, что моя программа на Python неправильно передает / кодирует параметр в созданный мной ASP-файл. Это мой пример кода: import urllib.request url = 'http://www.sample.com/myA…
08 ноя '12 в 12:14
1 ответ

Очистка второй страницы сайта в Python не работает

Допустим, я хочу очистить данные здесь. Я могу сделать это красиво, используя urlopen а также BeautifulSoup в Python 2.7. Теперь, если я хочу, чтобы очистить данные со второй страницы с этим адресом. То, что я получаю, это данные с первой страницы! …
3 ответа

Ошибка с urlopen: символ новой строки в поле без кавычек

Я использую urllib.urlopen с Python 2.7 для чтения файлов CSV, расположенных на внешнем веб-сервере: # Try & Except statements removed for clarity import urllib import csv url = ... csv_file = urllib.urlopen(url) for row in csv.reader(csv_file):…
19 янв '13 в 10:19
1 ответ

python urllib.request.urlopen рекурсия не удалась

Так что у меня есть код def constructGraph(self,url,doit=5): if doit!=0: m = urllib.request.urlopen(url) print('test') self.constructGraph('http://example.com',doit-1) но когда я запускаю его, запускается только первый m = urllib.request.urlopen(url…
04 мар '11 в 01:32
1 ответ

Python 3.6 urllib почему строка начинается с b

Я использую Python 3, и не понимаю, почему вывод имеет b в каждом начале строки. Я не думаю, что это так для Python 2. Почему это и как это удалить? Спасибо import urllib # fhand = urllib.urlopen('http://www.py4inf.com/code/romeo.txt') in Python 2 f…
30 апр '17 в 03:55
1 ответ

Python urllib2.urlopen(url).read() отличается от исходного кода в Firefox

Когда я использую urllib2.urlopen(url).read(), я читаю исходный код, немного отличающийся от того, что я читаю в Firefox. В исходном коде Firefox некоторые специальные символы, такие как кавычки ("), апостроф (') и т. Д., Преобразуются в%22, %27 и т…
06 сен '17 в 00:52
1 ответ

Извлечение страниц https с помощью urlopen и getpage()

Я пытаюсь получить веб-страницу "https" (например, для https://github.com/twitter/bootstrap), используя urlopen (), она возвращает страницу без проблем. Но мы оцениваем Twisted для нового проекта и пытаемся использовать getPage() для извлечения той …
05 ноя '11 в 03:50
1 ответ

Python 3, Beautifulsoup и чистка веб-страниц urlopen

Я просматриваю этот веб- сайт для получения информации о таких продуктах, как описание продукта и цена. веб-сайт использует нумерацию страниц, чтобы загрузить только первые 20 продуктов, и когда я делаю очистку, моя программа просто получает первые …
1 ответ

ElementTree - ParseError: неправильно сформирован (неверный токен)

Я пытаюсь открыть файл XML, используя urlopen и читая его. Тем не менее, я продолжаю получать следующую ошибку: xml.etree.ElementTree.ParseError: неправильно сформирован (неверный токен) Вот код: def wx(icao): if re.search(r'!wx *\w', icao): icao = …
0 ответов

Urlopen в течение цикла

Я пытаюсь извлечь некоторую информацию из веб-страницы, и у меня есть следующий код: import re from math import ceil from urllib.request import urlopen as uReq, Request from bs4 import BeautifulSoup as soup InitUrl="https://mtgsingles.gr/search?q=" …
21 май '18 в 15:35