Описание тега duke
Duke - это быстрый и гибкий механизм дедупликации (или разрешения сущностей, или связывания записей), написанный на Java поверх Lucene.
3
ответа
Герцог - org.apache.lucene.analysis.standard.StandardAnalyzer
https://github.com/larsga/Duke - я использую Duke - для дедупликации данных. Я установил Duke (файлы jar - jar Duke, а также lucene jar добавлены в путь к классам).. Пример примера в github - https://github.com/larsga/Duke/wiki/SemanticDogfood When…
22 мар '16 в 17:42
2
ответа
Быстрая дедупликация Duke: java.lang.UnsupportedOperationException: Операция еще не поддерживается?
Я пытаюсь использовать Duke Fast Deduplication Engine для поиска дубликатов записей в базе данных в компании, где я работаю. Я запускаю его из командной строки следующим образом: java -cp "C:\utils\duke-0.6\duke-0.6.jar;C:\utils\duke-0.6\lucene-core…
11 окт '12 в 17:39
0
ответов
Дедупликация Duke: не могу найти точные записи
Я пытаюсь создать конфигурацию и процессор для Duke, чтобы найти точные совпадения в списке записей. Я создал процессор на основе ExactMatchComparator, но функция не возвращает точные совпадения. Вот настройки процессора, конфигурации и слушателей: …
27 окт '16 в 08:33
0
ответов
Герцог делает действие на дубликат записи
Я создал приложение, которое находит дубликаты записей, используя DUKE код: public static void main(String[] args) throws IOException, SAXException { Configuration config = ConfigLoader .load("<path>/src/main/recources/namebase.xml"); Processo…
18 сен '18 в 10:37
1
ответ
Дедупликация в Duke: связывание записей не работает?
Я пытаюсь использовать Duke для сопоставления записей из одной базы данных в другую. Один БД имеет названия песен + писатели. Я пытаюсь сопоставить другую базу данных, чтобы найти дубликаты и соответствующие записи. Я заставил герцога бежать, и я ви…
10 фев '15 в 23:40
1
ответ
Дедупликация Duke: точно такая же запись не совпадает
Я пытаюсь использовать Duke для сопоставления записей из одного CSV в другой. Первый CSV и второй оба имеет ID,Model,Price,CompanyName,Review,Url колонны. Я пытаюсь сопоставить с другим CSV, чтобы найти дубликаты записей. package no.priv.garshol.duk…
07 окт '15 в 11:47
0
ответов
Конфигурация Duke Record Linkage XML
У меня проблема с этой связью записей: у меня есть эти два CSV-файла и идеальное отображение, я использовал эту конфигурацию, но Дьюк всегда дает мне 0 найденных ссылок. Возможно, я выбрал неправильные пороги? Кто-то может мне помочь? https://www.dr…
07 июн '17 в 12:07
0
ответов
Ищете библиотеки, поддерживающие дедупликацию на объекте
Я собираюсь работать над некоторыми проектами, чтобы иметь дело с дедупликацией сущностей. Наборы данных (один или несколько), которые могут содержать повторяющиеся объекты. В реальном времени объект может представлять имя, адрес, страну, адрес элек…
06 сен '19 в 08:31
0
ответов
ClassNotFoundException при обновлении версии dukes до 1.6.19.raptorio
Мы пытаемся обновить версию dukes с 1.5.4 до 1.6.19, и мы получаем журналы ниже Вызвано: java.lang.ClassNotFoundException:com.ebay.dukes.CacheSpecificationsStore.CacheSpecificationsStoreCleanup Не могли бы вы помочь с проблемой
26 авг '21 в 00:05