Описание тега urlopen
Urlopen - это метод библиотеки urllib в Python, используемый для открытия определенного URL-адреса.
1
ответ
Код Python3 для извлечения только одной конкретной строки из исходного кода веб-страницы
В моем коде я использую urlopen, но он извлекает всю веб-страницу. Можно ли получить только один конкретный номер строки исходного кода веб-страницы, чтобы оптимизировать мою программу скажем, например, я хочу напечатать строку номер 135 из исходног…
03 июл '14 в 10:01
1
ответ
Python: сохранить страницу с большим количеством графики в виде файла.html
Я хочу сохранить посещенную страницу на диске в виде файла. Я использую urllib и URLOpener. Я выбираю сайт http://emma-watson.net/. Файл правильно сохраняется в формате.html, но когда я открыл файл, я заметил, что главное изображение сверху, которое…
22 июл '14 в 21:48
2
ответа
Почему python urllib2 urlopen возвращает что-то отличное от браузера при вызове API
Мне нужно регулярно получать и анализировать данные XML с веб-сайта в форме: https://api.website.com/stuff/getCurrentData?security_key=blah Я не могу опубликовать фактические соединения из-за безопасного характера данных. Когда я помещаю этот URL-ад…
31 май '13 в 13:39
2
ответа
Выполните рукопожатие только один раз
Я использую urllib.request.urlopen получать данные с сервера через HTTPS, Функция часто вызывается на один и тот же сервер, часто на один и тот же URL. Однако, в отличие от стандартных веб-браузеров, которые выполняют рукопожатие по первоначальному …
25 янв '16 в 19:38
0
ответов
Ошибка соединения SSL 777 или тайм-аут соединения с использованием urlopen python3.6
У меня есть один URL, который дает мне ответ JSON. Я использую оболочку Python 3.6.3. >>> from urllib.request import urlopen >>> url = "https://test_url.com" >>> urlopen(url) Эта команда дает мне правильные результаты и об…
15 мар '18 в 06:14
1
ответ
Mercurial и nginx. Ошибка 10054
Когда я отправляю файлы на сервер, то через 60 секунд я получаю "urlopen error [Errno 10054]". Я думаю, это потому, что я толкаю большие файлы. Я использую веб-сервер nginx с процессом fast-cgi. Какой параметр nginx отвечает за этот тайм-аут 60 секу…
23 июл '11 в 10:44
3
ответа
Урлопен душит меня новыми строками
Я соскребаю простые текстовые файлы с URL. def scrape_contents_ex(url): data = urllib2.urlopen(url) return data.read() Проблема в том, что строка, которую она дает, забита символами новой строки и табуляции "\t", "\r" и т. Д. Пример: Вот веб-страниц…
01 май '16 в 02:30
2
ответа
Как я могу загрузить файл в Python3 с помощью urlopen() или добавить пользовательские заголовки в urlretrieve()?
Я хочу сделать скачать файл с сервера, который позволяет только определенные User-Agents, Мне удалось получить 200 OK с сайта, используя следующий код: opener = urllib.request.build_opener() opener.addheaders = [('User-Agent', 'Interwebs Exploiter 4…
26 сен '17 в 12:33
0
ответов
Получение http.client.BadStatusLine с помощью urlopen(IP).read()
Данные, которые я пытаюсь прочитать, представлены в формате xml. Перед объявлением xml есть один пробел. Я не могу редактировать эту часть, так как она жестко запрограммирована в источнике данных. Я могу только читать из него. Когда URL введен в IE,…
28 мар '13 в 19:48
1
ответ
Получение текста ошибки из `urllib2.urlopen`
Я использовал Python urllib2.urlopen и получил ошибку 500 с сервера. Как мне найти текст ошибки? Я надеюсь, что у него есть полезная информация.
26 май '11 в 15:15
3
ответа
Как передать параметр в Url с помощью Python urlopen
В настоящее время я новичок в программировании на Python. Моя проблема в том, что моя программа на Python неправильно передает / кодирует параметр в созданный мной ASP-файл. Это мой пример кода: import urllib.request url = 'http://www.sample.com/myA…
08 ноя '12 в 12:14
1
ответ
Очистка второй страницы сайта в Python не работает
Допустим, я хочу очистить данные здесь. Я могу сделать это красиво, используя urlopen а также BeautifulSoup в Python 2.7. Теперь, если я хочу, чтобы очистить данные со второй страницы с этим адресом. То, что я получаю, это данные с первой страницы! …
14 май '15 в 04:36
3
ответа
Ошибка с urlopen: символ новой строки в поле без кавычек
Я использую urllib.urlopen с Python 2.7 для чтения файлов CSV, расположенных на внешнем веб-сервере: # Try & Except statements removed for clarity import urllib import csv url = ... csv_file = urllib.urlopen(url) for row in csv.reader(csv_file):…
19 янв '13 в 10:19
1
ответ
python urllib.request.urlopen рекурсия не удалась
Так что у меня есть код def constructGraph(self,url,doit=5): if doit!=0: m = urllib.request.urlopen(url) print('test') self.constructGraph('http://example.com',doit-1) но когда я запускаю его, запускается только первый m = urllib.request.urlopen(url…
04 мар '11 в 01:32
1
ответ
Python 3.6 urllib почему строка начинается с b
Я использую Python 3, и не понимаю, почему вывод имеет b в каждом начале строки. Я не думаю, что это так для Python 2. Почему это и как это удалить? Спасибо import urllib # fhand = urllib.urlopen('http://www.py4inf.com/code/romeo.txt') in Python 2 f…
30 апр '17 в 03:55
1
ответ
Python urllib2.urlopen(url).read() отличается от исходного кода в Firefox
Когда я использую urllib2.urlopen(url).read(), я читаю исходный код, немного отличающийся от того, что я читаю в Firefox. В исходном коде Firefox некоторые специальные символы, такие как кавычки ("), апостроф (') и т. Д., Преобразуются в%22, %27 и т…
06 сен '17 в 00:52
1
ответ
Извлечение страниц https с помощью urlopen и getpage()
Я пытаюсь получить веб-страницу "https" (например, для https://github.com/twitter/bootstrap), используя urlopen (), она возвращает страницу без проблем. Но мы оцениваем Twisted для нового проекта и пытаемся использовать getPage() для извлечения той …
05 ноя '11 в 03:50
1
ответ
Python 3, Beautifulsoup и чистка веб-страниц urlopen
Я просматриваю этот веб- сайт для получения информации о таких продуктах, как описание продукта и цена. веб-сайт использует нумерацию страниц, чтобы загрузить только первые 20 продуктов, и когда я делаю очистку, моя программа просто получает первые …
19 апр '18 в 06:01
1
ответ
ElementTree - ParseError: неправильно сформирован (неверный токен)
Я пытаюсь открыть файл XML, используя urlopen и читая его. Тем не менее, я продолжаю получать следующую ошибку: xml.etree.ElementTree.ParseError: неправильно сформирован (неверный токен) Вот код: def wx(icao): if re.search(r'!wx *\w', icao): icao = …
14 дек '14 в 15:00
0
ответов
Urlopen в течение цикла
Я пытаюсь извлечь некоторую информацию из веб-страницы, и у меня есть следующий код: import re from math import ceil from urllib.request import urlopen as uReq, Request from bs4 import BeautifulSoup as soup InitUrl="https://mtgsingles.gr/search?q=" …
21 май '18 в 15:35