Описание тега porter-stemmer

An algorithm designed to remove common morphological and inflectional endings from English words.
0 ответов

Портер Стеммер используется в поиске по сайту

Я использовал версию PHP алгоритма определения слова Портера Стеммера, доступную здесь http://tartarus.org/~martin/PorterStemmer/ для поисковой системы на моем сайте. Проблема в том, что я только что заметил, что слово "смешной" меняется на "веселый…
15 мар '12 в 14:44
1 ответ

Встроенный Porter Stemmer в Java OpenNLP инструментарий

Как есть встроенные в Stemmers, такие как Porter Stemmer в Python NLTK ( /questions/11545467/nuzhen-modul-python-dlya-prohozhdeniya-tekstovyih-dokumentov/11545480#11545480), я хочу знать, есть ли встроенный Porter Stemmer в Java Java Apache OpenNLP,…
0 ответов

PorterStemmer Stemmer, не использующий слова, если только в конце строки (в Python)

Я создаю бота, который говорит о шахматах, и сейчас я занимаюсь предварительной обработкой. Проблема в том, что когда программа Python объединяет слова в строке, она ничего не сделает, если только слово не является последним словом. Это выход. Что я…
20 мар '16 в 20:15
1 ответ

PorterStemmer ошибка в приложении для Android

Я использую Lucene для определения слов. Я тестировал на Java-приложении (в основном), и оно работало отлично. Тем не менее, в моем приложении Android (в onCreate) это не работает. Кто-нибудь знает почему? Вот мой код в onCreate, в основном и ошибка…
11 авг '16 в 19:49
1 ответ

Алгоритм стемминга

У меня есть вопрос об алгоритме Портера Стеммера, я исследовал в Интернете, но я не мог найти, в чем разница между неполным и чрезмерным. и является ли алгоритм Портера недостаточным или чрезмерным? у тебя есть идея? заранее спасибо
25 ноя '12 в 14:42
1 ответ

Как получить доступ и записать каждое слово в массиве строк, прочитанных из файла на новый файл в C#?

Мой тестерфайл содержит: processes deleting agreed И этот код в C# PorterStemmer testing = new PorterStemmer(); string temp,stemmed; string[] lines = System.IO.File.ReadAllLines(@"C:\\Users\\PJM\\Documents\\project\\testerfile.txt"); System.Console.…
01 окт '16 в 14:37
1 ответ

Фильтр маркеров переопределения Elasticsearch Stemmer не работает, когда usind правила path

У меня возникла проблема при использовании фильтра токенов Stemmer Override с файлом со всеми правилами. Это не работает! При использовании встроенных правил все работает правильно. У кого-нибудь есть идея, почему это так? не работает пример: "protw…
23 окт '15 в 20:24
7 ответов

Есть ли Java-реализация Porter2

Знаете ли вы какую-либо java-реализацию стеммера Porter2 (или какой-нибудь лучший стеммер, написанный на java)? Я знаю, что здесь есть Java-версия Porter(не Porter2): http://tartarus.org/~martin/PorterStemmer/java.txt но на http://tartarus.org/~mart…
09 дек '10 в 10:21
1 ответ

НЛП: основа на наборе данных опкодов

У меня есть набор данных из 27 файлов, каждый из которых содержит коды операций. Я хочу использовать stemming, чтобы отобразить все версии одинаковых кодов операций в один и тот же код операции. Например: push, pusha, pushb и т. Д. Будут сопоставлен…
25 фев '19 в 20:22
1 ответ

Основные формы слова, не включенные в основы и лемматизацию

Мне нужно найти основные формы слов. Я прошел через одинаковые вопросы. Я использую Портер Стеммер и НЛП Стэнфордского ядра для стемминга и лемматизации. Рассмотрим следующие 3 набора слов A,B,C: Set Word Stem Lemma A Verity veriti verity (For all P…
2 ответа

Применять портеры stemmer к столбцу панд для каждого слова

У меня есть пандас dataframe под названием "data_stem" и есть столбец с именем "TWEET_SENT_1", в котором есть строки, как показано ниже (50 строк) TWEET_SENT_1 папа поцелуя крест мне понравилось это видео вечеринка я хочу применить средства портера …
05 май '17 в 01:58
1 ответ

Как остановить CSV-файл с помощью PorterStemmer в Python?

Я недавно делаю проект в NLP с использованием Python. где мне нужно предварительно обработать CSV-файл, который содержит текст с множеством строк и столбцов. Я смог получить только простые предложения. И не смог остановить сразу весь CSV-файл. Как я…
16 мар '16 в 01:29
2 ответа

Простой алгоритм с использованием String для ввода

Я смотрел на алгоритмы, основанные на словах, такие как алгоритм Портера, но все, что я нашел до сих пор, касалось файлов в качестве входных данных. Существуют ли какие-либо алгоритмы, которые позволили бы мне просто передать стеммер строку и вернут…
25 мар '14 в 14:23
2 ответа

Как вернуть слово NLTK в правильное слово?

После того, как я использую NLTK PorterStemmer для обозначения слова, слово иногда становится неполным, например, "получить" становится "полученным" после основы, что не является правильным словом. Итак, как я могу восстановить правильное слово NLTK…
13 янв '18 в 06:58
1 ответ

Почему SOLR KStemFilterFactory не связывает слово "карты" с "картой"?

Я использую KStem Filter Factory(KStemFF) в SOLR. Я понял, что KStemFF не на 100% точен. Например, это не означает, что слово "карты" означает "карта". "Звуковые карты" и "Звуковые карты" дают разные результаты. Есть ли способ заставить это работать…
01 сен '16 в 16:14
1 ответ

Массив ввода и другой вывод после использования PorterStemmer в php

Я использую PorterStemmer для определения слов так же, как "работает", это будет "работа" после вызова класса PorterStemmer, и это сработало для меня. Но я хочу ограничить предложение, например, если я добавлю это предложение в мой код: До "Я играю …
17 мар '16 в 12:59
1 ответ

Снежок Стеммер [Java]

В настоящее время я использую Snowball Stemmer (Porter2) в своем Java-проекте для определения слов и т. Д. Тем не менее, это связано со словами, которые либо не обязательно должны быть основаны, либо слишком много их содержат? Например, online ->…
15 фев '16 в 17:37
1 ответ

Найти способ работы с портером stemmer и кодировкой в ​​python

Я попытался прочитать файл и использовать PorterStemmer для хранения токенов текста в файлах, и я получил эту ошибку. tokens=preprocessTokens(line) File "/home/fl/git/KNN/preprocessDoc.py", line 20, in preprocessTokens line=line+' '+ps.stem(w) File …
16 апр '17 в 03:47
1 ответ

Вопрос об алгоритме Портера Стеммера

Я реализую поисковое приложение. Корпус больших текстовых документов. Во время обработки файла я пишу все слова и вызываю алгоритм Porter Stemmer Step1 (http://tartarus.org/~martin/PorterStemmer/csharp2.txt). Step1 избавляется от множественного числ…
06 ноя '10 в 16:09
1 ответ

Алгоритм Портера Стеммера в информационно-поисковой

Мне нужно создать простую поисковую систему для моего приложения. Давайте упростим это до следующего: у нас есть несколько текстов (много), и мне нужно искать и показывать релевантные результаты. Я основываюсь на этой замечательной статье, расширяю …