Описание тега pywikipedia
Pywikipedia - это пакет Python для использования ботов для автоматического редактирования вики MediaWiki, например, википедии. Он имеет много сценариев по умолчанию (например, поиск и замена одного), но также могут быть созданы пользовательские. Он использует MediaWiki API для запроса и загрузки информации. Он называется Pywikibot с нескольких лет.
6
ответов
Как мне получить HTML-код вики-страницы с помощью Pywikibot?
Я использую ядро pywikibot и раньше использовал другую оболочку Python Mediawiki API как Wikipedia.py (которая имеет метод.HTML). Я переключился на ядро Pywikibot, потому что я думаю, что у него гораздо больше возможностей, но я не могу найти по…
12 дек '14 в 11:33
1
ответ
Обработка ошибок неоднозначности?
Я использую wikipedia библиотека, и я хочу справиться с DisambiguationError как исключение. Моя первая попытка была try: wikipedia.page('equipment') # could be any ambiguous term except DisambiguationError: pass Во время исполнения строка 3 не дости…
01 сен '16 в 20:14
0
ответов
Соответствие строки / поиск для python
Я пытаюсь почистить и очистить данные Википедии. У меня есть поле данных, которое содержит размеры, как показано ниже. ["112 x 76 yards (102.4m x 69.4m)", "104.5 x 70.3 m", "107m x 72m", "109×73 yds / 100×67 m", "{{convert|105|x|68|m|yd|1}}", "100 m…
10 июн '18 в 20:09
0
ответов
Ошибка Юникода в Pywikipedia
При использовании pywikipedia для загрузки изображения в мою вики я получаю следующую ошибку независимо от изображения: ERROR: UnicodeDecodeError: 'ascii' codec can't decode byte 0xff in position 687: ordinal not in range(128) информация о моем envt…
22 май '14 в 06:49
2
ответа
Python: вернуть пустое значение при исключении
У меня есть некоторый опыт работы с Python, но я никогда не использовал функции try & кроме, чтобы ловить ошибки из-за отсутствия формального обучения. Я работаю над извлечением нескольких статей из Википедии. Для этого у меня есть массив заголовков…
24 ноя '15 в 15:19
1
ответ
Разбор Python 2.x Википедии
У меня есть этот код: import urllib from bs4 import BeautifulSoup base_url='https://en.wikipedia.org' start_url='https://en.wikipedia.org/wiki/Computer_programming' outfile_name='Computer_programming.csv' no_of_links=10 fp=open(outfile_name, 'wb') d…
02 янв '16 в 15:49
0
ответов
pywikibot: как работать с user-config.py, принадлежащим кому-то другому?
Я, вероятно, использую Pywikibot способами, которые выходили за рамки того, что проект был предназначен. Я хочу, чтобы несколько пользователей использовали один и тот же user-config.py, К сожалению, это дает мне эту ошибку: ВНИМАНИЕ: Пропущено "... …
24 сен '15 в 11:21
2
ответа
Как посчитать количество цитат / ссылок в википедии необработанного текста?
Я строю модель для классификации необработанного текста Википедии по качеству статьи (Википедия имеет набор данных из ~30000 статей ручной сортировки и соответствующих им уровней качества.). Тем не менее, я пытаюсь найти способ алгоритмически подсчи…
19 авг '18 в 01:51
5
ответов
Загрузка изображений из Wikimedia Commons
Кто-нибудь знает способ программной загрузки изображений из Wikimedia Commons без регистрации учетной записи Bot? Похоже, что единственный способ получить одобрение для учетной записи бота - это добавить или изменить информацию, уже имеющуюся в Вики…
23 сен '09 в 17:00
4
ответа
Могу ли я использовать Pywikipedia, чтобы получить только текст страницы?
Можно ли с помощью pywikipedia получить только текст страницы, без каких-либо внутренних ссылок или шаблонов, без картинок и т. Д.?
20 июн '09 в 15:49
2
ответа
Автоматизированные альтернативы созданию иерархических категорий в MediaWiki вручную?
Я хочу запустить сайт на основе mediaWiki, но вместо того, чтобы вручную добавлять категории и подкатегории, я хочу добавить их в автоматическом режиме, где я предоставляю что-то вроде файла XML, а бот / скрипт / алгоритм /... проходит по списку и а…
07 фев '13 в 17:58
2
ответа
Проблемы со скриптом Python на веб-хостинге
Я написал скрипт для Википедии, и он отлично работает на моем компьютере, но когда я загружаю его на свой веб-хостинг (Dreamhost), он не работает и говорит, что пользователь, которому я пытаюсь войти в систему, заблокирован - это не так. правда, это…
26 май '09 в 11:32
1
ответ
Почему pywikibot выдает <связанный метод Page.categories of Page (Wikipedia: Sandbox)> на выходе?
Я использую базовую версию PywikiBot в linux для создания программы, которая просто получает категории кода страницы Википедии: мой код: # -*- coding: utf-8 -*- import pywikibot site = pywikibot.Site("en") page = pywikibot.Page(site, u"Wikipedia:San…
25 май '14 в 14:40
1
ответ
Совпадение с чем угодно при поиске специального символа в регулярных выражениях Python
Я хочу использовать регулярное выражение, которое совпадает с чем угодно, но когда он находит специальный символ, перестает соответствовать.] Я хочу использовать этот шаблон \*\s*\[\[.* и когда это станет: ]] это перестает совпадать. Например, оно д…
19 фев '13 в 23:22
1
ответ
Получить описание недвижимости Викиданных?
Как мы можем получить удобочитаемое описание свойства Wikidata (например, P31), используя pywikibot?
21 мар '15 в 05:24
0
ответов
Используя pywikibot, как получить элементы с вложенными элементами внутри?
Используя этот пример, как мне получить значения взаимодействия на электронной странице? Я застрял в этом item_dict = item.get() clm_dict = item_dict["claims"] clm_list = clm_dict["P2069"] for clm in clm_list: clm_trgt = clm.getTarget() Все, что я п…
16 мар '17 в 12:06
4
ответа
Как ускорить Pywikibot?
Я построил некоторые инструменты отчетов, используя Pywikibot. Поскольку дела растут, теперь на подготовку отчетов уходит до 2 часов, поэтому я стремлюсь ускорить процесс. Основные идеи: Отключить регулирование, скрипт доступен только для чтения, по…
10 сен '15 в 12:08
2
ответа
Как Pywikipedia управляет цветами в командной строке?
Я всегда думал, что в командной строке нет возможности форматирования, поскольку все, что я прочитал, говорит. Тем не менее, я недавно обнаружил, что pywikipedia (платформа для python-бота для автоматического редактирования вики-стиля википедии) мож…
28 май '12 в 18:08
2
ответа
pywikipedia login.py socket.error: (10060, "Тайм-аут операции")
Я совершенно новичок в Python, так что, надеюсь, кто-то может помочь, если я делаю что-то явно неправильно. Я пытаюсь создать и запустить простого робота pywikipedia на vocabularies.referata.com, семантическом медиа-сайте вики. Я скачал дистрибутив …
02 сен '09 в 15:03
1
ответ
Регулярное выражение Python: как заменить строку, кроме случаев, когда другая строка существует в той же строке?
Я исправляю некоторые статьиreplace.pyзаменив"choeur" на "chœur". Есть также ссылки на файлы в синтаксисе MediaWiki: [[Fichier:Menditte (Pyr-Atl, Fr) choeur de l'église.JpG|thumb|Chœur de l'église]] Редактирование такого рода вещи сломает ссылку. Я …
30 май '14 в 00:28