Описание тега dedupeplugin
0
ответов
Компоненты кластеризации
При кластеризации я получаю следующее предупреждение UserWarning: A component contained 77760 elements. Components larger than 30000 are re-filtered. The threshold for this filtering is 4.08109134074e-15 Что это значит? Моя оригинальная пороговая сп…
06 апр '18 в 15:15
1
ответ
Дедупликация библиотек в приложении внутри глубоко вложенных узловых модулей
У меня есть приложение, в котором я могу добавить модули как node_modules. Теперь эти модули и приложение используют библиотеку XYZ в качестве модуля узла. Кроме того, эти модули имеют другие модули узлов, которые имеют свою собственную библиотеку X…
28 окт '15 в 18:03
0
ответов
dedupe trainingDataDedupe
Эта функция доступна только в API? Я использую библиотеку python, которая отлично работает, но пытаюсь использовать вышеуказанную функцию из сценария удобства. trainingDataDedupe(data,key, 10000) где данные и ключ предварительно определены как data …
21 мар '18 в 16:16
0
ответов
Использование компонентов React в комплекте с Webpack приводит к дублированию субмодулей
У нас есть 4 компонента React, связанные с Webpack (версия 1): A, B, C и D. Дерево зависимостей выглядит так: В D С D Мы хотим, чтобы каждый компонент можно было повторно использовать, поэтому мы используем веб-пакет для создания модуля UMD. Созданн…
15 фев '17 в 12:07
1
ответ
Webpack дедупликация
Будет ли webpack дедуплировать пакеты, которые уже были в комплекте с webpack? Например, | Webpack bundle 1 | |------------------| | react@15.5 | | jquery@3.0 | | Webpack app bundle | |--------------------| | react@15.5 | | jquery@3.1 | | Webpack bu…
15 май '17 в 13:38
1
ответ
Дедупе в питоне
Просматривая примеры библиотеки Dedupe в Python, которая используется для дедупликации записей, я обнаружил, что в выходном файле создается столбец Cluster Id, который в соответствии с документацией указывает, какие записи ссылаются друг на друга. Х…
18 май '16 в 05:43
2
ответа
SQL: Попытка и ошибка сортировки данных для отображения определенных месяцев
Я работаю над домашним заданием, и все было хорошо, пока я не дошел до этой точки. Мой профессор хочет, чтобы я извлекал даты только в марте, апреле и мае, без использования оператора BETWEEN. ПРИМЕЧАНИЕ: я не получаю никаких ошибок. Я использую EDU…
23 мар '16 в 00:33
0
ответов
SAS Array Dedupe
У меня есть вопрос о коде SAS ниже. Я новичок в массивах и что именно делает код ниже. Я понимаю, что есть два индекса ниже. Я считаю, что это выводит данные SAS из двух индексов. Я не совсем уверен. Спасибо за вашу помощь! data unix.txn_match_part_…
09 апр '18 в 18:35
1
ответ
Удалите одну новую строку для существующего набора данных
Я использую библиотеку дедупе Python. Подойдет любой пример кода, например. Допустим, у меня есть тренированный deduper и использовал его, чтобы успешно дедуплицировать набор данных. Теперь я добавляю одну новую строку в набор данных. Я хочу провери…
17 июн '19 в 22:51
0
ответов
ElasticSearch: обнаружение потенциальных дубликатов
У меня есть список названий компаний, которые могут содержать много дубликатов на основе нечеткого соответствия. Мне нужно иметь возможность идентифицировать потенциальные дубликаты, чтобы пользователь мог вручную просмотреть и решить, следует ли об…
17 фев '20 в 19:22
2
ответа
AttributeError: объект 'Dedupe' не имеет атрибута 'sample'
Я запускал csv_example.py из dedupe -examples. Я получил сообщение об ошибке, как показано ниже File "csv_example.py", line 111, in <module> deduper.sample(data_d, 15000) AttributeError: 'Dedupe' object has no attribute 'sample' Любая помощь б…
29 май '20 в 23:23
0
ответов
Можем ли мы использовать Python Dedupe Library с Nosql DB, например Mongo
Я просмотрел пакет dedupe python и обнаружил, что они привели несколько примеров с Mysql и PostgreSQL для дедупликации большого объема данных. Можно ли эффективно использовать библиотеку дедупликации на некоторых базах данных, отличных от sql, таких…
02 сен '20 в 12:37
0
ответов
Почему связывание записей в Dedupe.io дает разные идентификаторы кластера для совпадающих записей?
Привет, у меня есть следующие два файла, и я хочу найти совпадения между этими двумя файлами. Каждая запись в Test1.csv может соответствовать не более одной записи из Test2.csv, но несколько записей из Test1.csv могут соответствовать одной и той же …
13 мар '21 в 22:40