Описание тега keyword-extraction

Тег, связанный с задачей обработки естественного языка (NLP), которая заключается в автоматической идентификации терминов, которые лучше всего описывают предмет документа.
0 ответов

Улучшено извлечение ключевых слов для коротких документов

У меня есть большая база исторических событий с описаниями порядка 10-30 слов каждое. Я пытаюсь создать средство извлечения ключевых слов, которое будет разумно помечать каждый документ 1-3 граммами в отношении базы данных в целом, чтобы теги могли …
0 ответов

Ошибка извлечения ключевых слов на основе графа при создании сети ключевых слов

Для моего основного исследования мне нужно найти ключевые слова для записей пользователей с платформы разработки продукта, и я использую метод на основе графа-pagerank. Я наткнулся на коды, которые генерируют начальный график сети ключевых слов, а з…
1 ответ

Извлечение и ранжирование ключевых слов из короткого текста

Я работаю над проектом по извлечению ключевого слова из коротких текстов (3-4 предложения). С использованием spaCy Библиотека Я извлекаю фразы и NER и использую их как ключевые слова. Тем не менее, я хотел бы отсортировать их по значимости по сравне…
16 апр '19 в 20:22
0 ответов

Извлечение ключевого слова из файла PDF

Я хочу извлечь ключевые слова из файла PDF для использования на моем веб-сайте вместе с эластичным поиском. Код работает нормально, но вывод (ключевые слова) - это нечитаемые вещи. import PyPDF2 import textract import nltk nltk.download('punkt') fro…
0 ответов

Алгоритм рейтинга тем занимает много времени

Я использую алгоритм рейтинга тем для извлечения ключевых слов. В качестве вклада я передаю тезисы 50 научных работ. У меня есть следующий код. extractor.load_document(input=text, language="en", normalization='None') extractor.candidate_se…
0 ответов

Как извлечь из предложения список заранее определенных слов?

Есть ли способ эффективно извлечь предопределенное слово из предложения, подобного приведенному ниже коду? Поиск по запросу for очень неэффективен, и очень сложно сгруппировать извлеченные ключевые слова по предложениям. test_sentence = list("A B C …
06 сен '19 в 13:40
0 ответов

Я пытаюсь использовать алгоритм извлечения ключевых слов KEA

Я загрузил последний файл jar ( https://code.google.com/p/kea-algorithm/) и добавил его в свой путь к классам в eclipse. Но я получаю следующую ошибку: "Невозможно разрешить тип weka.core.OptionHandler. На него косвенно ссылаются из необходимых файл…
30 ноя '19 в 18:51
1 ответ

Индексатор строк, CountVectorizer Pyspark в одной строке

Привет, я столкнулся с проблемой, когда у меня есть строки с двумя столбцами массива слов. column1, column2 ["a", "b" ,"b", "c"], ["a","b", "x", "y"] В основном я хочу подсчитать появление каждого слова между столбцами, чтобы получить два массива: […
3 ответа

Как извлечь ключевые слова с помощью TFIDF для каждой строки в Python?

У меня есть столбец, в котором есть только текст. Мне нужно извлечь ключевые слова из каждой строки с помощью TFIDF. Пример ввода: df['Text'] 'I live in India', 'My favourite colour is Red', 'I Love Programming' Ожидаемый результат: df[Text] df[Keyw…
0 ответов

список слов из текстовых файлов; построение словаря для текстового анализа

У меня есть много текстовых файлов, содержащих статьи или документы по среде. Я хочу составить список слов (скажем, список из 25-30 слов). Этот список должен содержать слова, которые наиболее часто встречаются во всех (или, возможно, больше всего) т…
1 ответ

Найдите, если в английском языке фраза "вообще редко"

Я хочу извлечь из текста редкие слова. не редкость в этом тексте, но обычно редко встречается на английском языке. Есть ли модуль NLTK, который использует большой корпус, который может ответить на такой запрос?
06 дек '19 в 12:34
1 ответ

извлечение ключевой фразы python с использованием модуля pke

Я пытался извлечь ключевые фразы с помощью модуля https://github.com/boudinfl/pke. Когда я запускаю его один раз, он отлично работает. Но когда я запускаю его несколько раз, он выдает следующую ошибку. ZeroDivisionError: деление с плавающей запятой …
15 фев '20 в 13:34
0 ответов

Лучший способ найти подходящие билеты в любых инструментах для сбора билетов

У нас есть внутренние инструменты, в которых мы храним миллионы клиентских + внутренних билетов в течение многих лет. В основном он имеет три поля - Название заявки / Описание / Комментарии. Теперь инструмент ограничен поиском только по заголовку и …
1 ответ

извлечение ключевых слов и классификация текста на основе ключевых слов

В настоящее время я работаю над проектом, который требует извлечения ключевых слов или, можно сказать, классификации текста на основе ключевых слов. Набор данных содержит текст 3 столбца, ключевые слова и условия cc, мне нужно извлечь ключевые слова…
0 ответов

Извлечение ключевых слов из научных отчетов

Я работаю в институте, который проводит исследования в области физики, и за эти годы накопилось много отчетов об этих исследованиях. Эти отчеты составлены на немецком языке и содержат некоторую метаинформацию, результаты экспериментов в табличной фо…
23 ноя '20 в 13:35
0 ответов

ООП-программирование на Python для парсинга веб-страниц и извлечения ключевых слов не работает из-за ошибок в синтаксисе кода [закрыто]

Я пытаюсь включить этот фрагмент кода в синтаксис ООП. Код хорошо работает вне схемы ООП. Мне нужно поместить неопределенные переменные, взятые из ранее вызванных функций, внутри объектов, чтобы он работал, но я не знаю, как этого добиться! Любая по…
0 ответов

Извлеките ключевые слова из набора похожих предложений с помощью python

У меня есть список похожих предложений, и я хотел бы автоматически извлекать топ-n важных ключевых слов [длина одного слова] из всего набора этих предложений с помощью python. Эти предложения уже имеют нормализованную форму, так как они не содержат …
0 ответов

Python Rake для извлечения ключевых слов

Я пытаюсь использовать грабли в своем наборе данных для извлечения ключевых слов и фраз. Однако у меня возникли проблемы с применением этого к моему фрейму данных. мой код выглядит следующим образом: df = pd.read_csv('_________') def rake_implement(…
05 апр '21 в 18:48
0 ответов

Какие возможные значения частей речи (pos) доступны в библиотеке pke?

Я использую библиотеки pke MultipartiteRank и PositionRank для извлечения ключевых слов из входящего текста. Я хотел изучить возможные значения, которые может иметь гиперпараметр pos. Я просмотрел библиотеку и не нашел никакой вспомогательной докуме…
0 ответов

Импортировать документы DITA в Python

Я пытаюсь выполнить извлечение ключевых слов с помощью Rake-NLtk в python. С другой стороны, я должен работать с документами DITA (суффикс моих файлов - .dita). Не могли бы вы помочь мне здесь и подсказать, как мне импортировать документы DITA в кач…
15 июн '21 в 21:19