Описание тега dih
DataImportHandler - это компонент Solr, который обеспечивает управляемый конфигурацией способ импорта этих данных в Solr как в "полных сборках", так и с использованием инкрементного импорта дельты.
1
ответ
Лучший способ поиска динамического списка полей с помощью Solr?
Мы реализуем функцию поиска, используя Solr в качестве внутреннего движка. Данные извлекаются из базы данных с использованием DIH. Основная информация документа, в том числе: - product number (number) - product name (name) - applicant name (applican…
08 июл '13 в 12:13
0
ответов
Solr Throwing Error при полном импорте (с опцией clean = false)
Моя проблема заключается в том, что когда я полностью импортирую solr(через DIH), когда solr начинает извлекать документы из MySql, если я запрашиваю что-либо в это конкретное время, я получаю ошибку сервера, как показано ниже Примечание: во время р…
01 апр '15 в 12:48
1
ответ
Обработчик ввода данных SOLR ( DIH): извлечь адреса электронной почты во время индексации и поместить в другое поле?
У меня есть поле с именем main_text, которое содержит большие текстовые записи. Я хочу переиндексировать свои данные, создав новую коллекцию, но я хочу извлечь все адреса электронной почты из этого поля в новое специальное поле с именем emails_field…
07 май '14 в 18:55
1
ответ
Ошибка: "Отсутствует обязательное поле" с использованием встроенных объектов в файле конфигурации DIH Solr
Я пытаюсь импортировать несколько таблиц из базы данных MySQL с помощью обработчика импорта данных (DIH). DIH не импортирует данные из второй таблицы, подробно. Мой файл конфигурации базы данных <document> <entity name="item" pk="ListingId"…
14 ноя '12 в 01:09
1
ответ
Невозможно загрузить реализацию EntityProcessor
Я пытаюсь использовать mongo в качестве источника данных для solr поэтому я последовал за Джеймсом для его DIH, чтобы использовать его в моем приложении Solr, я добавил следующее в моем lib скоросшиватель Solr-dataimporthandler-1.4.1 Solr-Монго-импо…
19 фев '13 в 06:39
1
ответ
Обработчик импорта данных Solr работает на локальном хосте, а не на сервере
Я пытался настроить solr-DIH на сервере, который имеет около 5 миллионов документов, и он не работает, но он хорошо работает на моем локальном хосте с 100000 документов. В чем может быть проблема? это журнал, который я получаю Exception while proces…
15 апр '15 в 08:15
1
ответ
Использование памяти SOLR после индексации с помощью DIH
Я использую Solr 3.6. Я индексирую, используя DIH приблизительно 2,6 ГБ данных ежечасно (сейчас я использую полный импорт, но я также знаю и об импорте дельты). Я использую 24 ГБ ОЗУ только для JVM. Экземпляр solr - это многоядерная реализация (сейч…
21 июн '12 в 10:17
1
ответ
Импорт данных Apache Solr в Datastax Solr - DateFormat Transformer DIH
Я пытаюсь импортировать данные из Apache Solr в Datastax Solr, используя DIH. Я могу получить документ, но когда DIh пытается создать документ, я получаю следующую ошибку в полях даты: org.apache.solr.common.SolrException: Invalid Date String:'Thu J…
31 мар '17 в 20:32
1
ответ
Как масштабировать индексирование SOLR без использования DIH?
У меня есть около 20 миллионов документов в моем SOLR. Я использую DIH для индексации дельта-обновлений в SOLR. Индексирование дельта-импорта занимает около 2-3 часов за последний час, а полный импорт занимает около 5-6 часов. Есть ли способ ускорит…
18 май '15 в 05:25
1
ответ
Разделение столбца базы данных на многозначное поле Solr
Я схожу с ума, пытаясь выяснить, как получить обработчик импорта данных splitBy построить для работы. Я ожидал, что это разделит входной столбец в многозначное поле. Вот контрольный пример, чтобы воспроизвести проблему: import java.io.File; import j…
24 янв '13 в 22:33
2
ответа
Solr DIH динамическое имя файла и преобразовать значение
У меня есть рабочий solr с DIH, теперь мне нужно добавить несколько строк, что является отношением ОДИН к МНОГИМ с индексированным документом solr TABLE: ID:int PK post_id:int FK name:string value:text type:(int|string) Мне нужно вставить все строки…
30 май '11 в 20:01
3
ответа
Solr DIH delta-import с составными первичными ключами?
Мой источник данных Solr - это база данных SQL, где первичный ключ является составным (то есть это два поля). Это хорошо для моего основного DIH queryЯ просто объединяю поля, и это становится моим первичным ключом Solr. Однако из документации неясно…
22 дек '09 в 11:16
2
ответа
В чем разница между запросом на соединение и встроенными объектами в Solr DIH?
Я пытаюсь индексировать данные по нескольким таблицам с помощью Solr Data Import Handler. Официальная вики в DIH предлагает использовать встроенные сущности для связи нескольких таблиц, например: <document> <entity name="item" pk="id" query…
13 ноя '12 в 21:36
1
ответ
Solr 4.0 Delta-import 3 таблицы объединения
Я использую Solr 4.0 DIH(разъем JDBC) на Ubuntu. Я пытаюсь заставить следующий запрос MySQL JOIN работать с Solr на Delta-import: select c.*,u.*,g.* from user u inner join group g on u.bus_grp_id = g.dt_grp_id inner join customer c on c.id = g.dt_id…
15 фев '13 в 06:36
1
ответ
Solr DIH regextransformer - обрабатывает только одну линию CSV
Привет у меня есть следующий файл CSV 132 1536130302256087040 133 1536130302256087041 134 1536130302256087042 поля разделены вкладкой. Теперь у меня есть Dataimporthandler (DIH) для solr, и я пытаюсь импортировать CSV в solr, но я получаю только пер…
04 июн '16 в 10:46
0
ответов
Обработчик импорта данных solr занимает слишком много времени
Когда я пытаюсь импортировать все данные из базы данных с помощью команды полного импорта, SQL-запрос представляет собой три объединенные таблицы с каждой 1M записей. Это занимает слишком много времени для первого запроса к источнику данных. Я не по…
24 апр '13 в 05:08
0
ответов
Solr DIH Индексирование статуса почты
Я использую Solr DIH для индексирования электронных писем из Outlook. В первый раз, когда я начал процесс индексации, нужно было проиндексировать более 5000 электронных писем. По мере выполнения индексации не было обновлений ни одного из сообщений о…
04 окт '17 в 01:41
1
ответ
Можно ли вызвать dih с путем к файлу?
Я работаю над проектом, в котором журнал создается после каждой операции. Можно ли вызывать DIH всякий раз, когда создается новый журнал с путем к этому файлу в качестве параметра?
27 окт '12 в 14:45
1
ответ
Solr 4 - пропущено обязательное поле: uuid
У меня проблемы с генерацией UUID с использованием dataImportHandler в Solr4. Я пытаюсь импортировать из существующей базы данных MySQL. Мой schema.xml содержит: <fields> <field name="uuid" type="uuid" indexed="true" stored="true" required=…
04 июн '13 в 09:32
2
ответа
Конфигурация Solr DIH Mysql
<entity name="tw_tweet_user_merged" query="select * from tw_tweet_user_merged"> <field column="id" name="id" /> <field column="gender" name="gender" /> <entity name="tw_flag" query="select moderator_id from tw_flag where tweet_i…
06 дек '13 в 15:32