Python: Newspaper Module - загрузка с нескольких URL
Я не хочу начинать новую публикацию, но я пытаюсь выполнить точную вещь, описанную в этом вопросе: Python: Газетный модуль - Есть ли способ объединить получение статей прямо с URL?
Однако, пытаясь реализовать решение, я получаю следующую ошибку:
NameError Traceback (most recent call last)
<ipython-input-38-2707f1416873> in <module>()
----> 1 sources = [SingleSource(articleURL=u) for u in urls]
2
3 newspaper.news_pool.set(sources)
4 newspaper.news_pool.join()
5
<ipython-input-38-2707f1416873> in <listcomp>(.0)
----> 1 sources = [SingleSource(articleURL=u) for u in urls]
2
3 newspaper.news_pool.set(sources)
4 newspaper.news_pool.join()
5
<ipython-input-37-4949a9e51da5> in __init__(self, articleURL)
1 class SingleSource(newspaper.Source):
2 def __init__(self, articleURL):
----> 3 super(StubSource, self).__init__("http://localhost")
4 self.articles = [newspaper.Article(url=url)]
NameError: name 'StubSource' is not defined
Был бы очень признателен за толчок в правильном направлении.
1 ответ
Выглядит как опечатка в связанном ответе как StubSource
не определено
class SingleSource(newspaper.Source):
def __init__(self, articleURL):
super(StubSource, self).__init__("http://localhost")
self.articles = [newspaper.Article(url=url)]
Вероятно, должно быть:
class SingleSource(newspaper.Source):
def __init__(self, articleURL):
super(SingleSource, self).__init__("http://localhost")
self.articles = [newspaper.Article(url=url)]