Питон, газета, тип unhashable: 'tzutc' и запись в dataframe
У меня есть куча URL-адресов, которые я хочу скачать и провести дальнейший анализ. Я новичок в питоне. У меня две проблемы: (1) У меня действительно странная ошибка типа; и (2) результаты не записываются во фрейм данных. Мой код выглядит следующим образом:
smallURL= ['http://www.walesonline.co.uk/business/business-news/more-70-jobs-created-bio-12836127','http://economictimes.indiatimes.com/articleshow/61006825.cms?utm_source=contentofinterest&utm_medium=text&utm_campaign=cppst','http://100seguro.com.ar/telefonica-pone-en-venta-su-aseguradora-antares-vida/','http://13wham.com/news/local/urmc-opens-newest-urgent-care-facility']
import pandas
import datetime
f = open('myfile', 'w')
#lista= ['http://www.walesonline.co.uk/business/business-news/more-70-jobs-created-bio-12836127','http://economictimes.indiatimes.com/articleshow/61006825.cms?utm_source=contentofinterest&utm_medium=text&utm_campaign=cppst','http://100seguro.com.ar/telefonica-pone-en-venta-su-aseguradora-antares-vida/','http://13wham.com/news/local/urmc-opens-newest-urgent-care-facility']
df = pandas.DataFrame(columns=('d', 'datetime', 'title', 'text','keywords', 'url'))
from newspaper import Article
for index in range(len(smallURL)):
#url = "https://www.bloomberg.com/news/articles/2017-11-10/microsoft-and-google-turn-to-ai-to-catch-amazon-in-the-cloud"
article = Article(smallURL[index])
#1 . Download the article
#try:
article.download()
#f.write('article.title+\n')
#except:
#pass
#2. Parse the article
try:
article.parse()
f.write('article.title+\n')
except:
pass
#Print article title
#print(article.title)
article.title
#3. Fetch Author Name(s)
print(article.authors)
#4. Fetch Publication Date
if article.publish_date is None:
d = datetime.datetime.now().date()
else:
d = article.publish_date
#5. Print article text
print(article.text)
#6. Natural Language Processing on Article to fetch Keywords
#article.nlp()
#Print Keywords
print(article.keywords)
#7. Generate Summary of the article
#print(article.url)
print(article.url)
df.loc[index] = [d, datetime.datetime.now().date(), article.title, article.text,article.keywords,article.url]
Мой вывод включает в себя:
[] http://100seguro.com.ar/telefonica-pone-en-venta-su-aseguradora-antares-vida/ Traceback (последний вызов был последним):
Файл "", строка 1, в исполняемом файле ('C:/Users/theiman/Desktop/untitled7.py', wdir='C:/Users/theiman/Desktop')
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", строка 710, в исполняемом файле runfile(имя файла, пространство имен)
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", строка 101, в execfile exec(compile(f.read(), имя файла, 'exec'), пространство имен)
Файл "C:/Users/theiman/Desktop/untitled7.py", строка 57, в df.loc[index] = [d, datetime.datetime.now(). Date(), article.title, article.text,article.keywords,article.url]
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\indexing.py", строка 179, в setitem self._setitem_with_indexer (индексатор, значение)
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\indexing.py", строка 425, в _setitem_with_indexer self.obj._data = self.obj.append(значение)._данные
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\frame.py", строка 4533, в добавлении other = other._convert(datetime=True, timedelta=True)
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\generic.py", строка 3472, в _convert copy=copy)).завершить(самостоятельно)
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\internals.py", строка 3227, в конвертируемом возвращении self.apply('convert', **kwargs)
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\internals.py", строка 3091, в apply apply = getattr(b, f)(**kwargs)
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\internals.py", строка 1892, в конвертируемых значениях = fn(values.ravel(), **fn_kwargs))
Файл "C:\Users\theiman\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\dtypes\cast.py", строка 740, в soft_convert_objects values = lib.maybe_convert_objects(values, convert_datetime=datetime)
Файл "pandas/_libs/src\inference.pyx", строка 1204, в файле pandas._libs.lib.maybe_convert_objects
TypeError: unhashable тип: 'tzutc'
Любая идея о том, что идет не так и как я могу это исправить? Спасибо!!