Описание тега data-harvest

1 ответ

Ошибка комбайна CKAN в nav_named_link

В CKAN, когда я пытаюсь создать новый источник урожая, я получаю эту ошибку: Error - <class 'jinja2.exceptions.UndefinedError'>: 'ckan.lib.helpers.HelperAttributeDict object' has no attribute 'nav_named_link URL: https://127.0.0.1:5000/harvest…
21 апр '16 в 11:12
1 ответ

Сбор данных с помощью rvest не получает значения из виджета данных

Я пытаюсь собрать данные, используя rvest (также пытался использовать XML а также selectr) но у меня возникают проблемы со следующей проблемой: В веб-инспекторе моего браузера HTML выглядит так <span data-widget="turboBinary_tradologic1_rate" cla…
15 фев '17 в 11:50
4 ответа

Как проверить GoogleBot

Я хочу запретить сбор данных на моем сайте (кроме googlebot, конечно). Я полагаю, что полагаться на UserAgent ГБ недостаточно сильно (каждый бот может его подделать) Как я могу все еще аутентифицировать GoogleBot, чтобы избежать подделок.
22 дек '11 в 06:34
1 ответ

Как я могу отобразить страницу XML вместо JSON, для набора данных

Я использую расширение pycsw для создания файла CSW. Я собрал данные из одного экземпляра CKAN [1] в другой [2] и теперь пытаюсь запустить команду pycsw 'paster load': paster ckan-pycsw load -p /etc/ckan/default/pycsw.cfg -u [CKAN INSTANCE] Я получа…
10 сен '15 в 16:15
0 ответов

Сбор урожая из ТРЕТЬЕВ с использованием GeoNetwork

У меня есть экземпляр THREDDS: https://wci.earth2observe.eu/thredds/catalog-earth2observe.html и я ищу способ получения данных в стандартном формате ISO-19115. Я перепробовал много решений и сейчас пытаюсь получить информацию в имеющийся у меня экзе…
22 сен '15 в 10:54
1 ответ

Комбайн ckan: ошибка "Нет модуля с именем pika"

На экземпляре ckan, работающем нормально, я установил расширение харвестера, следуя этому руководству: https://github.com/ckan/ckanext-harvest Вот шаги, которые я следовал: . /usr/lib/ckan/default/bin/activate cd /usr/lib/ckan/default/src/ckan sudo …
23 янв '15 в 00:07
3 ответа

Сканирование новостных статей

Кто-нибудь знает, есть ли стандарты / API для сканирования новостных статей из большинства крупнейших источников новостей. Я использую rss для их индексации, но я хотел бы классифицировать их с большим количеством данных, чем просто их заголовки.
11 ноя '09 в 11:09
0 ответов

Сбор данных с веб-страницы в R - доступ к нескольким страницам

Я следую за своим вопросом со вчерашнего дня - собираю данные через выпадающий список в R 1 Во-первых, мне нужно получить все 50 тыс. строк данных всех врачей на этой странице: http://www.lkcr.cz/seznam-lekaru-426.html Я знаю, как получить их на одн…
27 окт '16 в 09:53
1 ответ

Сбор данных обучения

Я хочу создать сайт, который будет собирать данные с: * статуса Facebook моих друзей * другого сайта К сожалению, я не знаю, как собирать данные. Может кто-нибудь порекомендовать книгу \ учебник? Как проверить это поле?
22 июл '11 в 16:46
0 ответов

ЦКАН: урожай заблокирован

Я не знаю точно, где проблема, поэтому я пишу здесь, чтобы получить несколько советов или подсказок об этом. Я хотел бы знать, есть ли у кого-то мнение или идея по этому поводу. Сбор данных с помощью ckan, кажется, работает (я могу получить данные н…
05 сен '16 в 07:09
1 ответ

Собрать php API-массив в json

Используя php API Harvest http://mdbitz.com/harvest-api/examples/ и мой php-массив урожай выводит следующие данные: $myresult = $harvestAPI->getUser($client_id); $data = $myresult->get( "data" ); print_r($data); данные: Harvest_User Object ( […
03 авг '15 в 20:44
0 ответов

DCAT RDF Ошибки сбора

Я попробовал DCAT RDF Harvesting в ckan. Общий сбор данных в ckan работает хорошо, но сбор урожая в DCAT RDF, похоже, не добавляет много возможностей настройки. Как я могу устранить эту ошибку и получить данные с https://www.europeandataportal.eu/??…
21 июл '17 в 01:26
2 ответа

Использование ссылки PHP/JavaScript для получения информации о посетителе сайта

Кто-то пытается меня обмануть, они притворяются одним из моих близких друзей, чтобы унизить нас обоих. Этот человек создал поддельную учетную запись электронной почты, выдавая себя за человека и пытаясь получить от меня личную информацию. Я убедился…
02 дек '14 в 23:23
3 ответа

Автоматическое нажатие кнопки "отправить" с использованием Python

Автобусная компания, которой я пользуюсь, ведет ужасный веб-сайт (на иврите, английском), который делает простой запрос "От А до Б сегодня" - кошмаром. Я подозреваю, что они пытаются поощрять использование дорогостоящей системы SMS-запросов. Я пытаю…
04 июл '09 в 15:00
1 ответ

Сбор данных в R: получить вложенные списки, удалить список, внести изменения, вернуть их обратно

Следующий код собирает данные с веб-сайта. Я извлекаю список списков, хочу удалить один из списков, отредактировать его, а затем повторно вставить его обратно в данные в форму, в которой они были получены. Вот мой код ниже, он не проходит одно повто…
15 авг '17 в 09:55
2 ответа

Поиск нескольких значений из одной ячейки

У меня есть набор данных, в котором много разных категорий и данных были помещены в одну ячейку. Например, у меня есть одна ячейка с именами лиц и процентами: Jess 15%, Frank 20%, Allan 50%, Steve 15% Я хотел бы найти функцию, которая может искать и…
15 окт '15 в 19:50
0 ответов

Получить общий размер данных, собранных с помощью теплового инструмента

Я использовал Heat.exe, предоставленный WiX. Требуется копия структуры каталогов, которая называется сбором каталогов. Я хочу получить общий размер данных, которые он собирает. Есть ли решение для этого, пожалуйста, помогите. Заранее спасибо.
22 июн '17 в 08:48
1 ответ

Жатки, использующие расширение DCAT, застряли

Мы использовали ckanext-dcat для сбора данных из удаленных источников json, иногда некоторые задания сбора данных не завершались, и их приходилось удалять вместе со всеми наборами данных из этого источника, что не очень удобно, но затем все возвраща…
04 окт '14 в 02:11
1 ответ

Вложенная функция для извлечения данных из нескольких URL (с аутентификацией) в R

Мой код ниже предназначен для извлечения данных (и их метаданных) с аутентификацией через конечную точку API и возврата всех метаданных в фрейм данных. Я хочу создать вложенную функцию, чтобы повторить этот же процесс для другой конечной точки API с…
07 авг '17 в 21:02
0 ответов

В веб-браузере CKAN я не вижу наборы данных в списке, но в потоке активности, нужен ли дополнительный модуль?

Использование команды oai-pmh для отправки метаданных из dspace в ckan. Я могу видеть файлы (пакеты) в потоке активности, но не в списке наборов данных. Ссылка в потоке активности ведет к данным на поверхности dspace. также в БД я вижу записи для па…
09 апр '19 в 09:47