Описание тега fuzzy-search

A search mechanism where the objective is to find all approximate, relevant or possibly relevant results for the search-key rather than finding an exact match.
1 ответ

org.hibernate.impl.SessionImpl не может быть приведен к org.hibernate.engine.spi.SessionImplementor при использовании полнотекстового поиска

Я использую hibernate-search-4.5.2.Final для реализации полнотекстового поиска, но получаю исключение со следующим сообщением org.hibernate.impl.SessionImpl не может быть приведен к org.hibernate.engine.spi.SessionImplementor в следующей строке Full…
26 фев '15 в 07:34
1 ответ

Шаблон SQL для сопоставления через таблицу перевода

У меня есть грязные данные из 2 разных источников. Я ищу некоторые лучшие практики для их соответствия. Вот несколько примеров данных: Source1.Name Source2.Name Adda Clevenger Jr Prep School Adda Clevenger Junior Preparatory School Alice Fong Yu Alt…
07 окт '13 в 20:26
1 ответ

Странное поведение в экстракте FuzzyWuzzy

Я пытаюсь использовать FuzzyWuzzy, чтобы исправить неправильно написанные имена в тексте. Однако я не могу заставить process.extract и process.extractOne вести себя так, как я ожидал. from fuzzywuzzy import process the_text = 'VICTOR HUGO e MARIANA …
22 май '18 в 12:53
4 ответа

Найти серию данных, используя неточные измерения (нечеткая логика)

Это более сложный дополнительный вопрос: Эффективный способ поиска последовательных значений Каждый продукт может иметь много строк сегмента (тысячи). Каждый сегмент имеет столбец положения, который начинается с 1 для каждого продукта (1, 2, 3, 4, 5…
2 ответа

Быстрый динамический нечеткий поиск по 100 000+ строк в C#

Допустим, они являются предварительно загруженными символами, напечатанными в текстовом поле. Я ищу код, который я могу скопировать, а не библиотеку для установки. Это было вдохновлено этим вопросом: Существуют ли библиотеки для нечеткого поиска или…
12 май '11 в 01:06
1 ответ

R: agrep с векторным рисунком

У меня есть вектор шаблонов, и мне нужно использовать agrep на них. Проблема в том, что agrep кажется, берет только один образец за один раз. patt <- c("test","10 Barrel") lut <- c("1 Barrel","10 Barrel Brewing","Harpoon 100 Barrel Series","re…
15 июл '15 в 15:54
0 ответов

Нахождение нечеткого среднего отношения определенных слов в текстовом файле

Я пытаюсь найти нечеткое соотношение между определенными словами в текстовом файле и получить его среднее значение. Я написал код, который найдет нечеткое соотношение всех строк в текстовом файле с "привет", но не определенными словами. Я хотел найт…
05 окт '14 в 11:33
1 ответ

Замените повторяющиеся значения из столбца данных, используя нечеткое совпадение

Я пытаюсь использовать библиотеку ('RecordLinkage') и функцию compare.dedup() для замены повторяющихся значений в одном столбце. Как и в этом посте, у меня есть один вектор tv3 = c("TOURDEFRANCE", 'TOURDEFRANCE', "TOURDE FRANCE", "TOURDE FRANZ", "GE…
02 ноя '15 в 22:15
2 ответа

Нечеткий поиск по фразе Lucene (FuzzyQuery + SpanQuery)

Я ищу способ кодирования нечеткого запроса lucene, который ищет все документы, которые имеют отношение к конкретной фразе. Если я выполню поиск "Оценки сотрудника Мозаики", в результате будет возвращен документ, содержащий "Оценки большинства сотруд…
07 авг '13 в 09:53
2 ответа

Rails: какой метод rails нечеткий /gem/plugin используется для поиска в таблице базы данных на 1 миллион записей?

У меня есть ~1 миллион записей MySQL таблицы. Мне скоро нужно будет добавить поиск в мое приложение Rails 3.x. Я хочу, чтобы поиск был нечетким. На самом деле, я использую плагин (rails-fuzzy-search) для другой таблицы, но это только 3000 записей. Э…
28 апр '13 в 20:30
1 ответ

НЛП - Улучшение времени выполнения и восстановление нечеткого соответствия строк

Я сделал алгоритм работы, но время работы очень ужасно. Да, я знаю с самого начала, что это будет ужасно, но не так сильно. Всего за 200000 записей программа работает более часа. В основном то, что я делаю, это: for each searchfield in search fields…
24 апр '12 в 01:33
0 ответов

Java Fuzzy Поиск имени сущности с опечатками и сокращениями

Мне нужно реализовать в Java нечеткий поиск имени объекта, например, имени производителя, который позаботится о (a) typos, as well as (b) shortened forms like limited, Ltd, etc Скажем, мне нужно определить, что все последующие 1–7 относятся к одной …
18 июн '14 в 10:56
0 ответов

Соответствие имени с фреймами данных различной длины в R

У меня есть два кадра данных с многочисленными переменными. Первостепенное значение имеют следующие переменные, df1.organization_name и df2.legal.name. Я просто использую полные имена SQL-esque здесь. df1 имеет размеры 15 x 2700, тогда как df2 имеет…
10 мар '16 в 22:34
1 ответ

Легкая поисковая система рельсов

Я ищу легкий поисковик в рельсах. Он не предназначен для полнотекстового поиска или чего-то еще, я делаю простое текстовое поле с автозаполнением. По сути, для данной строки мне нужно найти два строковых столбца в моей таблице и вернуть наиболее рел…
1 ответ

Нечеткий запрос ElasticSearch и чувствительность к регистру

Я только начал изучать ElasticSearch и у меня возникли вопросы по нечеткому запросу. Допустим, у меня был такой документ: { "name": "Frankie's Hot Dogs" } Используя нечеткий запрос, если бы я искал по следующим параметрам, я бы не получил результато…
22 июл '14 в 09:37
2 ответа

Как программно найти варианты конкретного слова в предложении?

Иногда данные, которые вы получаете, не являются чистыми и имеют вариации используемых слов, с ошибками или манипуляциями. Можем ли мы найти такие примеры наиболее близкого сходства слов в предложении? Например, если я ищу слово "Awesome", которое и…
14 июн '16 в 20:05
0 ответов

Нечеткие совпадающие номера деталей

В настоящее время у меня есть список номеров деталей, которые необходимо классифицировать. Они могут иметь различные формы, такие как - Часть: XYZK-RF или Аллен Часть: XYZK-RF - Датчик. Код ниже работает для передачи списка номеров деталей в. def fu…
3 ответа

Python: проверьте, содержит ли предложение какое-либо слово из списка (с нечетким соответствием)

Я хотел бы извлечь ключевые слова из предложения, указанного в list_of_keywords. Мне удалось извлечь точные слова [word for word in Sentence if word in set(list_of_keywords)] Можно ли извлечь слова, которые имеют хорошее сходство с заданным list_of_…
21 фев '19 в 13:01
2 ответа

Нечеткое совпадение подстроки в строке Lucene.NET

Я только что установил Lucene.NET. Я делаю текстовый поиск. Я хочу проверить, содержит ли большой текст / нечеткое соответствие слова / фразы, скажем: Eg1: текст: "Я разместил вопрос о Lucene.NET на stackru. Получу ли я ответ?" textToSearch: "опубли…
11 окт '17 в 23:12
2 ответа

Нечеткое совпадение тегов с актами как теги

Поэтому я использую Act_as_taggable на модели. Я хотел бы быть в состоянии найти теги с какой-то %LIKE% соответствие, но я не уверен, как. Мой текущий код: @companies = Company.tagged_with(@query, :any => true) делать это не работает: tagged_with…