Описание тега textmatching

0 ответов

Как сопоставить предложения в двух одинаковых текстах?

У меня есть два одинаковых текста (на самом деле набор таких пар). Чтобы проиллюстрировать, в каком смысле они похожи: один из них представляет собой оригинальный письменный текст, другой получен путем распознавания речи устного чтения первого. Поэт…
1 ответ

Сопоставьте все виды цен в тексте с использованием регулярных выражений

Я использую следующее регулярное выражение для следующего вида текста ниже Regex: [\s](rs|price)?([\s.]*\d+[\s\d.]*)(pkg|k|(?:la(?:c|kh|k)|crore|cr)s?|l)[\s.] Текст: 65 lac this is 55 lac. and more price 100 lac. randome text to test price45 crs. an…
2 ответа

Модуль Perl или код для нахождения перекрывающейся области двух строк

У меня есть две строки. Они не являются подстроками друг друга, но между ними существует перекрывающаяся область. my $str1 = "AAAAAAAAAABBBBBBBBCC"; my $str2 = "BBBBBBBBCCZZZZZZZZZZ"; Я хочу найти этот перекрывающийся регион. "AAAAAAAAAABBBBBBBBCC" …
06 июн '14 в 14:00
7 ответов

Как сопоставить URI в тексте?

Как можно найти URI в блоке текста? Идея состоит в том, чтобы превратить такие прогоны текстов в ссылки. Это довольно просто сделать, если рассматривать только схемы http (s) и ftp (s); Тем не менее, я предполагаю, что общая проблема (с учетом tel, …
17 сен '08 в 12:10
1 ответ

Как считать varchar в varchar с помощью TSQL

Каков наилучший способ подсчитать возникновение варчара внутри варчара? Я скорее не перебираю текст, чтобы найти определенные комбинации. Этот выбор только найти первый SELECT CASE WHEN CHARINDEX('!','HOW MANY TIMES IS ! IN THIS TEXT ? THIS IS MY QU…
10 июл '11 в 14:51
1 ответ

Сопоставлять столбцы и хранить все дублированные элементы в столбце фрейма данных [R]

У меня есть два кадра данных; DF1 имеет 3 столбца, а DF2 имеет один столбец. В DF1 есть все элементы, содержащиеся в DF2, но большинство из них дублируются, как показано ниже. DF1= ***freetext***, ***specific***, ***ICDcode*** Jaundice,hepatitisA,B,…
04 июн '14 в 05:22
1 ответ

Проблема с соответствием текста stristr в PHP

Я запускаю довольно простой скрипт, который пытается сопоставить строки из CSV-файла с потенциальными совпадениями в таблице MySQL (сопоставление: ut8_general_ci). Для каждой строки в файле csv я вынимаю нужную строку (стог сена), которая выглядит п…
04 апр '11 в 22:01
2 ответа

Сходство и соответствие текста Python - увеличение веса, когда термины вместе

У меня есть два столбца в пандах, которые содержат последовательность терминов, и моя цель состоит в том, чтобы найти запись из столбца B, которая наиболее близко соответствует записям в столбце A. Я использовал TF-IDF, чтобы найти сходство между дв…
18 май '17 в 11:11
3 ответа

Сопоставление текста - неструктурированные данные со структурированными данными - в SAS или R

Мне нужно знать, как отобразить неструктурированные данные в структурированные данные. У меня есть переменная с адресами клиентов, которая включает их города. Название города, например, DELHI, может иметь форму "DELHI", "DEHLI", "DILLI", "DELI", и м…
19 дек '13 в 05:35
5 ответов

Как использовать LIKE в запросе, чтобы найти несколько слов?

У меня есть столик id name class mark 1 John Deo Matt Four 75 2 Max Ruin Three 85 3 Arnold Three 55 4 Krish Star HN Four 60 5 John Mike Four 60 6 Alex John Four 55 Я хотел бы найти клиента, который может быть указан как John Matt без deo строка. Как…
21 окт '15 в 08:47
2 ответа

Как мне сопоставить два простых текстовых файла построчно, используя Python

Согласно моему требованию, я хочу сопоставлять два текстовых файла построчно в Python на платформе Windows. например у меня есть следующие текстовые файлы: File1: Меня зовут ххх Команда выполнена успешно. Мою маму зовут ггг Мой мобильный номер 12345…
11 янв '17 в 10:35
3 ответа

MySQL проблемы с текстовыми соответствиями с использованием оператора IN

У меня большая таблица (2 миллиона строк) с колонкой, содержащей текстовые идентификаторы (это латинские названия видов, Homo_sapiens, Tyranosaurus_rex и т. Д.) У меня есть другая таблица, содержащая латинские названия и "общие" названия видов, и я …
18 окт '16 в 08:54
1 ответ

Нормализация строк для сопоставления текста с preg_replace

Я выполняю довольно простое сопоставление текста между набором имен из моей базы данных MySQL и набором строк из файла CSV. Перед фактическим сравнением я запускаю preg_replace с массивом опций для нормализации строк. Одна из важных замен - изменени…
06 апр '11 в 23:17
2 ответа

Javascript/Jquery: Как предупредить текст метки, который содержит мой поиск?

Привет, я искал и нашел разные вещи, основанные примерно на этом и некоторые более тесно связанные, но я не смог придумать и создать работоспособное решение для моей проблемы: Резюме: Я хочу создать вид особым образом из-за моих требований. В настоя…
03 июл '15 в 14:17
4 ответа

Печать несовпадающих (уникальных) строк в файле

Я пытаюсь создать функцию, которая открывает файл (filename), печатает каждую строку текста, которая отличается от предыдущей строки (первая строка всегда пишется). Каждая строка вывода должна иметь префикс с номером строки во входном файле. Я прише…
27 ноя '14 в 11:30
2 ответа

Приблизительное сопоставление и обновление текста одновременно

У меня есть фрейм данных как df1, который содержит столбец с названием университета как University_name и имеет 500000 строк. Теперь у меня есть другой фрейм данных как df2, который содержит 2 столбца, как имя_университета и имя_университета, и соде…
17 мар '18 в 10:01
0 ответов

PostgreSQL Trigram неожиданные результаты

Этот запрос: SELECT word_similarity('pears', 'peach pear'), similarity('pears', 'pear') UNION ALL SELECT word_similarity('pear', 'peach pears'), similarity('pear', 'pears'); Производит: Я неясен в двух вещах: Как так word_similarity а также similari…
24 ноя '17 в 07:49
1 ответ

Лучший способ сопоставить 2 текстовых документа

Я пытаюсь создать такое программное обеспечение, которое интеллектуально делает 2 текстовых документа, вроде проверки соответствия текста, а не как DIFF. Я искал в Google довольно много, и я нашел 2 вещи - Graph & TFIDF. Но я запутался между ними об…
06 янв '15 в 15:48
4 ответа

Использование предложения if внутри регулярного выражения

Я в настоящее время кодирую приложение Windows.net, используя vb.net. Я пытаюсь передать регулярное выражение Regex.Match извлечь определенные тексты из статьи. Как мне написать условие if в регулярном выражении? Я прочитал этот шпаргалку регулярног…
13 апр '11 в 08:15
1 ответ

Проверьте, содержатся ли все буквы в Small-String в Large-String

Я пытаюсь написать некоторый код, чтобы определить, содержатся ли буквы в маленькой строке в большей строке в R. Точность будет возвращаться в процентах. Я нашел следующее в Stackru ( проверьте, все ли символы одной строки существуют в другой строке…
28 янв '18 в 10:44