Описание тега fuzzy-search
A search mechanism where the objective is to find all approximate, relevant or possibly relevant results for the search-key rather than finding an exact match.
1
ответ
org.hibernate.impl.SessionImpl не может быть приведен к org.hibernate.engine.spi.SessionImplementor при использовании полнотекстового поиска
Я использую hibernate-search-4.5.2.Final для реализации полнотекстового поиска, но получаю исключение со следующим сообщением org.hibernate.impl.SessionImpl не может быть приведен к org.hibernate.engine.spi.SessionImplementor в следующей строке Full…
26 фев '15 в 07:34
1
ответ
Шаблон SQL для сопоставления через таблицу перевода
У меня есть грязные данные из 2 разных источников. Я ищу некоторые лучшие практики для их соответствия. Вот несколько примеров данных: Source1.Name Source2.Name Adda Clevenger Jr Prep School Adda Clevenger Junior Preparatory School Alice Fong Yu Alt…
07 окт '13 в 20:26
1
ответ
Странное поведение в экстракте FuzzyWuzzy
Я пытаюсь использовать FuzzyWuzzy, чтобы исправить неправильно написанные имена в тексте. Однако я не могу заставить process.extract и process.extractOne вести себя так, как я ожидал. from fuzzywuzzy import process the_text = 'VICTOR HUGO e MARIANA …
22 май '18 в 12:53
4
ответа
Найти серию данных, используя неточные измерения (нечеткая логика)
Это более сложный дополнительный вопрос: Эффективный способ поиска последовательных значений Каждый продукт может иметь много строк сегмента (тысячи). Каждый сегмент имеет столбец положения, который начинается с 1 для каждого продукта (1, 2, 3, 4, 5…
07 ноя '11 в 20:40
2
ответа
Быстрый динамический нечеткий поиск по 100 000+ строк в C#
Допустим, они являются предварительно загруженными символами, напечатанными в текстовом поле. Я ищу код, который я могу скопировать, а не библиотеку для установки. Это было вдохновлено этим вопросом: Существуют ли библиотеки для нечеткого поиска или…
12 май '11 в 01:06
1
ответ
R: agrep с векторным рисунком
У меня есть вектор шаблонов, и мне нужно использовать agrep на них. Проблема в том, что agrep кажется, берет только один образец за один раз. patt <- c("test","10 Barrel") lut <- c("1 Barrel","10 Barrel Brewing","Harpoon 100 Barrel Series","re…
15 июл '15 в 15:54
0
ответов
Нахождение нечеткого среднего отношения определенных слов в текстовом файле
Я пытаюсь найти нечеткое соотношение между определенными словами в текстовом файле и получить его среднее значение. Я написал код, который найдет нечеткое соотношение всех строк в текстовом файле с "привет", но не определенными словами. Я хотел найт…
05 окт '14 в 11:33
1
ответ
Замените повторяющиеся значения из столбца данных, используя нечеткое совпадение
Я пытаюсь использовать библиотеку ('RecordLinkage') и функцию compare.dedup() для замены повторяющихся значений в одном столбце. Как и в этом посте, у меня есть один вектор tv3 = c("TOURDEFRANCE", 'TOURDEFRANCE', "TOURDE FRANCE", "TOURDE FRANZ", "GE…
02 ноя '15 в 22:15
2
ответа
Нечеткий поиск по фразе Lucene (FuzzyQuery + SpanQuery)
Я ищу способ кодирования нечеткого запроса lucene, который ищет все документы, которые имеют отношение к конкретной фразе. Если я выполню поиск "Оценки сотрудника Мозаики", в результате будет возвращен документ, содержащий "Оценки большинства сотруд…
07 авг '13 в 09:53
2
ответа
Rails: какой метод rails нечеткий /gem/plugin используется для поиска в таблице базы данных на 1 миллион записей?
У меня есть ~1 миллион записей MySQL таблицы. Мне скоро нужно будет добавить поиск в мое приложение Rails 3.x. Я хочу, чтобы поиск был нечетким. На самом деле, я использую плагин (rails-fuzzy-search) для другой таблицы, но это только 3000 записей. Э…
28 апр '13 в 20:30
1
ответ
НЛП - Улучшение времени выполнения и восстановление нечеткого соответствия строк
Я сделал алгоритм работы, но время работы очень ужасно. Да, я знаю с самого начала, что это будет ужасно, но не так сильно. Всего за 200000 записей программа работает более часа. В основном то, что я делаю, это: for each searchfield in search fields…
24 апр '12 в 01:33
0
ответов
Java Fuzzy Поиск имени сущности с опечатками и сокращениями
Мне нужно реализовать в Java нечеткий поиск имени объекта, например, имени производителя, который позаботится о (a) typos, as well as (b) shortened forms like limited, Ltd, etc Скажем, мне нужно определить, что все последующие 1–7 относятся к одной …
18 июн '14 в 10:56
0
ответов
Соответствие имени с фреймами данных различной длины в R
У меня есть два кадра данных с многочисленными переменными. Первостепенное значение имеют следующие переменные, df1.organization_name и df2.legal.name. Я просто использую полные имена SQL-esque здесь. df1 имеет размеры 15 x 2700, тогда как df2 имеет…
10 мар '16 в 22:34
1
ответ
Легкая поисковая система рельсов
Я ищу легкий поисковик в рельсах. Он не предназначен для полнотекстового поиска или чего-то еще, я делаю простое текстовое поле с автозаполнением. По сути, для данной строки мне нужно найти два строковых столбца в моей таблице и вернуть наиболее рел…
27 июн '11 в 01:54
1
ответ
Нечеткий запрос ElasticSearch и чувствительность к регистру
Я только начал изучать ElasticSearch и у меня возникли вопросы по нечеткому запросу. Допустим, у меня был такой документ: { "name": "Frankie's Hot Dogs" } Используя нечеткий запрос, если бы я искал по следующим параметрам, я бы не получил результато…
22 июл '14 в 09:37
2
ответа
Как программно найти варианты конкретного слова в предложении?
Иногда данные, которые вы получаете, не являются чистыми и имеют вариации используемых слов, с ошибками или манипуляциями. Можем ли мы найти такие примеры наиболее близкого сходства слов в предложении? Например, если я ищу слово "Awesome", которое и…
14 июн '16 в 20:05
0
ответов
Нечеткие совпадающие номера деталей
В настоящее время у меня есть список номеров деталей, которые необходимо классифицировать. Они могут иметь различные формы, такие как - Часть: XYZK-RF или Аллен Часть: XYZK-RF - Датчик. Код ниже работает для передачи списка номеров деталей в. def fu…
20 фев '18 в 16:55
3
ответа
Python: проверьте, содержит ли предложение какое-либо слово из списка (с нечетким соответствием)
Я хотел бы извлечь ключевые слова из предложения, указанного в list_of_keywords. Мне удалось извлечь точные слова [word for word in Sentence if word in set(list_of_keywords)] Можно ли извлечь слова, которые имеют хорошее сходство с заданным list_of_…
21 фев '19 в 13:01
2
ответа
Нечеткое совпадение подстроки в строке Lucene.NET
Я только что установил Lucene.NET. Я делаю текстовый поиск. Я хочу проверить, содержит ли большой текст / нечеткое соответствие слова / фразы, скажем: Eg1: текст: "Я разместил вопрос о Lucene.NET на stackru. Получу ли я ответ?" textToSearch: "опубли…
11 окт '17 в 23:12
2
ответа
Нечеткое совпадение тегов с актами как теги
Поэтому я использую Act_as_taggable на модели. Я хотел бы быть в состоянии найти теги с какой-то %LIKE% соответствие, но я не уверен, как. Мой текущий код: @companies = Company.tagged_with(@query, :any => true) делать это не работает: tagged_with…
05 июл '13 в 20:46