Код Python3 для извлечения только одной конкретной строки из исходного кода веб-страницы
В моем коде я использую urlopen, но он извлекает всю веб-страницу. Можно ли получить только один конкретный номер строки исходного кода веб-страницы, чтобы оптимизировать мою программу
скажем, например, я хочу напечатать строку номер 135 из исходного кода этой ссылки www.ncbi.nlm.nih.gov/snp/?term=273898673?term=273898673
mycode:
from urllib.request import urlopen
query="www.ncbi.nlm.nih.gov/snp/?term=273898673?term=273898673"
data=urlopen(query)
html = data.read()
codec = data.info().get_param('charset', 'utf8')
data = html.decode(codec)
print (data)
Могу ли я выполнить настройку urlopen()?
PS у меня есть Python 3.X
1 ответ
Вы можете использовать перечисление, чтобы получить конкретный номер строки, не читая все в памяти сразу:
import urllib.request
response = urllib.request.urlopen('http://www.ncbi.nlm.nih.gov/snp/?term=273898673?term=273898673')
for line_number, line in enumerate(response):
# Because this is 0-index based
if line_number == 134:
print line
# Stop reading
elif line_number > 134:
break