Описание тега pywikipedia

Pywikipedia - это пакет Python для использования ботов для автоматического редактирования вики MediaWiki, например, википедии. Он имеет много сценариев по умолчанию (например, поиск и замена одного), но также могут быть созданы пользовательские. Он использует MediaWiki API для запроса и загрузки информации. Он называется Pywikibot с нескольких лет.
6 ответов

Как мне получить HTML-код вики-страницы с помощью Pywikibot?

Я использую ядро ​​pywikibot и раньше использовал другую оболочку Python Mediawiki API как Wikipedia.py (которая имеет метод.HTML). Я переключился на ядро ​​Pywikibot, потому что я думаю, что у него гораздо больше возможностей, но я не могу найти по…
12 дек '14 в 11:33
1 ответ

Обработка ошибок неоднозначности?

Я использую wikipedia библиотека, и я хочу справиться с DisambiguationError как исключение. Моя первая попытка была try: wikipedia.page('equipment') # could be any ambiguous term except DisambiguationError: pass Во время исполнения строка 3 не дости…
01 сен '16 в 20:14
0 ответов

Соответствие строки / поиск для python

Я пытаюсь почистить и очистить данные Википедии. У меня есть поле данных, которое содержит размеры, как показано ниже. ["112 x 76 yards (102.4m x 69.4m)", "104.5 x 70.3 m", "107m x 72m", "109×73 yds / 100×67 m", "{{convert|105|x|68|m|yd|1}}", "100 m…
10 июн '18 в 20:09
0 ответов

Ошибка Юникода в Pywikipedia

При использовании pywikipedia для загрузки изображения в мою вики я получаю следующую ошибку независимо от изображения: ERROR: UnicodeDecodeError: 'ascii' codec can't decode byte 0xff in position 687: ordinal not in range(128) информация о моем envt…
22 май '14 в 06:49
2 ответа

Python: вернуть пустое значение при исключении

У меня есть некоторый опыт работы с Python, но я никогда не использовал функции try & кроме, чтобы ловить ошибки из-за отсутствия формального обучения. Я работаю над извлечением нескольких статей из Википедии. Для этого у меня есть массив заголовков…
24 ноя '15 в 15:19
1 ответ

Разбор Python 2.x Википедии

У меня есть этот код: import urllib from bs4 import BeautifulSoup base_url='https://en.wikipedia.org' start_url='https://en.wikipedia.org/wiki/Computer_programming' outfile_name='Computer_programming.csv' no_of_links=10 fp=open(outfile_name, 'wb') d…
02 янв '16 в 15:49
0 ответов

pywikibot: как работать с user-config.py, принадлежащим кому-то другому?

Я, вероятно, использую Pywikibot способами, которые выходили за рамки того, что проект был предназначен. Я хочу, чтобы несколько пользователей использовали один и тот же user-config.py, К сожалению, это дает мне эту ошибку: ВНИМАНИЕ: Пропущено "... …
24 сен '15 в 11:21
2 ответа

Как посчитать количество цитат / ссылок в википедии необработанного текста?

Я строю модель для классификации необработанного текста Википедии по качеству статьи (Википедия имеет набор данных из ~30000 статей ручной сортировки и соответствующих им уровней качества.). Тем не менее, я пытаюсь найти способ алгоритмически подсчи…
19 авг '18 в 01:51
5 ответов

Загрузка изображений из Wikimedia Commons

Кто-нибудь знает способ программной загрузки изображений из Wikimedia Commons без регистрации учетной записи Bot? Похоже, что единственный способ получить одобрение для учетной записи бота - это добавить или изменить информацию, уже имеющуюся в Вики…
4 ответа

Могу ли я использовать Pywikipedia, чтобы получить только текст страницы?

Можно ли с помощью pywikipedia получить только текст страницы, без каких-либо внутренних ссылок или шаблонов, без картинок и т. Д.?
20 июн '09 в 15:49
2 ответа

Автоматизированные альтернативы созданию иерархических категорий в MediaWiki вручную?

Я хочу запустить сайт на основе mediaWiki, но вместо того, чтобы вручную добавлять категории и подкатегории, я хочу добавить их в автоматическом режиме, где я предоставляю что-то вроде файла XML, а бот / скрипт / алгоритм /... проходит по списку и а…
07 фев '13 в 17:58
2 ответа

Проблемы со скриптом Python на веб-хостинге

Я написал скрипт для Википедии, и он отлично работает на моем компьютере, но когда я загружаю его на свой веб-хостинг (Dreamhost), он не работает и говорит, что пользователь, которому я пытаюсь войти в систему, заблокирован - это не так. правда, это…
26 май '09 в 11:32
1 ответ

Почему pywikibot выдает <связанный метод Page.categories of Page (Wikipedia: Sandbox)> на выходе?

Я использую базовую версию PywikiBot в linux для создания программы, которая просто получает категории кода страницы Википедии: мой код: # -*- coding: utf-8 -*- import pywikibot site = pywikibot.Site("en") page = pywikibot.Page(site, u"Wikipedia:San…
25 май '14 в 14:40
1 ответ

Совпадение с чем угодно при поиске специального символа в регулярных выражениях Python

Я хочу использовать регулярное выражение, которое совпадает с чем угодно, но когда он находит специальный символ, перестает соответствовать.] Я хочу использовать этот шаблон \*\s*\[\[.* и когда это станет: ]] это перестает совпадать. Например, оно д…
19 фев '13 в 23:22
1 ответ

Получить описание недвижимости Викиданных?

Как мы можем получить удобочитаемое описание свойства Wikidata (например, P31), используя pywikibot?
21 мар '15 в 05:24
0 ответов

Используя pywikibot, как получить элементы с вложенными элементами внутри?

Используя этот пример, как мне получить значения взаимодействия на электронной странице? Я застрял в этом item_dict = item.get() clm_dict = item_dict["claims"] clm_list = clm_dict["P2069"] for clm in clm_list: clm_trgt = clm.getTarget() Все, что я п…
4 ответа

Как ускорить Pywikibot?

Я построил некоторые инструменты отчетов, используя Pywikibot. Поскольку дела растут, теперь на подготовку отчетов уходит до 2 часов, поэтому я стремлюсь ускорить процесс. Основные идеи: Отключить регулирование, скрипт доступен только для чтения, по…
10 сен '15 в 12:08
2 ответа

Как Pywikipedia управляет цветами в командной строке?

Я всегда думал, что в командной строке нет возможности форматирования, поскольку все, что я прочитал, говорит. Тем не менее, я недавно обнаружил, что pywikipedia (платформа для python-бота для автоматического редактирования вики-стиля википедии) мож…
28 май '12 в 18:08
2 ответа

pywikipedia login.py socket.error: (10060, "Тайм-аут операции")

Я совершенно новичок в Python, так что, надеюсь, кто-то может помочь, если я делаю что-то явно неправильно. Я пытаюсь создать и запустить простого робота pywikipedia на vocabularies.referata.com, семантическом медиа-сайте вики. Я скачал дистрибутив …
02 сен '09 в 15:03
1 ответ

Регулярное выражение Python: как заменить строку, кроме случаев, когда другая строка существует в той же строке?

Я исправляю некоторые статьиreplace.pyзаменив"choeur" на "chœur". Есть также ссылки на файлы в синтаксисе MediaWiki: [[Fichier:Menditte (Pyr-Atl, Fr) choeur de l'église.JpG|thumb|Chœur de l'église]] Редактирование такого рода вещи сломает ссылку. Я …