Получение http.client.BadStatusLine с помощью urlopen(IP).read()

Данные, которые я пытаюсь прочитать, представлены в формате xml. Перед объявлением xml есть один пробел. Я не могу редактировать эту часть, так как она жестко запрограммирована в источнике данных. Я могу только читать из него. Когда URL введен в IE, данные появляются. При вводе в Chrome/Firefox отображается ошибка, но данные можно просматривать из источника просмотра.

Есть ли способ с Python, чтобы либо убрать это пространство или игнорировать его, как кажется, IE делает?

(пытался добавить strip() во многих местах)

Или есть способ по умолчанию для источника страницы (я думаю, что urlopen это уже делает)?

Вот строка с ошибкой:

html = urlopen(address).read()

Вот ошибка:

Traceback (most recent call last):
File "C:\Users\212311674\Desktop\Python Work\M10url.py", line 27, in <module>
  html = urlopen(address).read()
File "C:\Python33\lib\urllib\request.py", line 160, in urlopen
  return opener.open(url, data, timeout)
File "C:\Python33\lib\urllib\request.py", line 473, in open
  response = self._open(req, data)
File "C:\Python33\lib\urllib\request.py", line 491, in _open
  '_open', req)
File "C:\Python33\lib\urllib\request.py", line 451, in _call_chain
  result = func(*args)
File "C:\Python33\lib\urllib\request.py", line 1272, in http_open
  return self.do_open(http.client.HTTPConnection, req)
File "C:\Python33\lib\urllib\request.py", line 1257, in do_open
  r = h.getresponse()
File "C:\Python33\lib\http\client.py", line 1131, in getresponse
  response.begin()
File "C:\Python33\lib\http\client.py", line 354, in begin
  version, status, reason = self._read_status()
File "C:\Python33\lib\http\client.py", line 336, in _read_status
  raise BadStatusLine(line)
http.client.BadStatusLine:  <?xml version="1.0"?><controller_history_cnd>

Заранее спасибо!

0 ответов

Другие вопросы по тегам