Описание тега keyword-extraction
Тег, связанный с задачей обработки естественного языка (NLP), которая заключается в автоматической идентификации терминов, которые лучше всего описывают предмет документа.
0
ответов
Улучшено извлечение ключевых слов для коротких документов
У меня есть большая база исторических событий с описаниями порядка 10-30 слов каждое. Я пытаюсь создать средство извлечения ключевых слов, которое будет разумно помечать каждый документ 1-3 граммами в отношении базы данных в целом, чтобы теги могли …
25 ноя '18 в 23:21
0
ответов
Ошибка извлечения ключевых слов на основе графа при создании сети ключевых слов
Для моего основного исследования мне нужно найти ключевые слова для записей пользователей с платформы разработки продукта, и я использую метод на основе графа-pagerank. Я наткнулся на коды, которые генерируют начальный график сети ключевых слов, а з…
22 мар '19 в 20:23
1
ответ
Извлечение и ранжирование ключевых слов из короткого текста
Я работаю над проектом по извлечению ключевого слова из коротких текстов (3-4 предложения). С использованием spaCy Библиотека Я извлекаю фразы и NER и использую их как ключевые слова. Тем не менее, я хотел бы отсортировать их по значимости по сравне…
16 апр '19 в 20:22
0
ответов
Извлечение ключевого слова из файла PDF
Я хочу извлечь ключевые слова из файла PDF для использования на моем веб-сайте вместе с эластичным поиском. Код работает нормально, но вывод (ключевые слова) - это нечитаемые вещи. import PyPDF2 import textract import nltk nltk.download('punkt') fro…
14 июл '19 в 01:29
0
ответов
Алгоритм рейтинга тем занимает много времени
Я использую алгоритм рейтинга тем для извлечения ключевых слов. В качестве вклада я передаю тезисы 50 научных работ. У меня есть следующий код. extractor.load_document(input=text, language="en", normalization='None') extractor.candidate_se…
29 июл '20 в 13:28
0
ответов
Как извлечь из предложения список заранее определенных слов?
Есть ли способ эффективно извлечь предопределенное слово из предложения, подобного приведенному ниже коду? Поиск по запросу for очень неэффективен, и очень сложно сгруппировать извлеченные ключевые слова по предложениям. test_sentence = list("A B C …
06 сен '19 в 13:40
0
ответов
Я пытаюсь использовать алгоритм извлечения ключевых слов KEA
Я загрузил последний файл jar ( https://code.google.com/p/kea-algorithm/) и добавил его в свой путь к классам в eclipse. Но я получаю следующую ошибку: "Невозможно разрешить тип weka.core.OptionHandler. На него косвенно ссылаются из необходимых файл…
30 ноя '19 в 18:51
1
ответ
Индексатор строк, CountVectorizer Pyspark в одной строке
Привет, я столкнулся с проблемой, когда у меня есть строки с двумя столбцами массива слов. column1, column2 ["a", "b" ,"b", "c"], ["a","b", "x", "y"] В основном я хочу подсчитать появление каждого слова между столбцами, чтобы получить два массива: […
07 фев '20 в 22:00
3
ответа
Как извлечь ключевые слова с помощью TFIDF для каждой строки в Python?
У меня есть столбец, в котором есть только текст. Мне нужно извлечь ключевые слова из каждой строки с помощью TFIDF. Пример ввода: df['Text'] 'I live in India', 'My favourite colour is Red', 'I Love Programming' Ожидаемый результат: df[Text] df[Keyw…
20 апр '20 в 10:22
0
ответов
список слов из текстовых файлов; построение словаря для текстового анализа
У меня есть много текстовых файлов, содержащих статьи или документы по среде. Я хочу составить список слов (скажем, список из 25-30 слов). Этот список должен содержать слова, которые наиболее часто встречаются во всех (или, возможно, больше всего) т…
06 июн '20 в 09:24
1
ответ
Найдите, если в английском языке фраза "вообще редко"
Я хочу извлечь из текста редкие слова. не редкость в этом тексте, но обычно редко встречается на английском языке. Есть ли модуль NLTK, который использует большой корпус, который может ответить на такой запрос?
06 дек '19 в 12:34
1
ответ
извлечение ключевой фразы python с использованием модуля pke
Я пытался извлечь ключевые фразы с помощью модуля https://github.com/boudinfl/pke. Когда я запускаю его один раз, он отлично работает. Но когда я запускаю его несколько раз, он выдает следующую ошибку. ZeroDivisionError: деление с плавающей запятой …
15 фев '20 в 13:34
0
ответов
Лучший способ найти подходящие билеты в любых инструментах для сбора билетов
У нас есть внутренние инструменты, в которых мы храним миллионы клиентских + внутренних билетов в течение многих лет. В основном он имеет три поля - Название заявки / Описание / Комментарии. Теперь инструмент ограничен поиском только по заголовку и …
27 июл '20 в 17:55
1
ответ
извлечение ключевых слов и классификация текста на основе ключевых слов
В настоящее время я работаю над проектом, который требует извлечения ключевых слов или, можно сказать, классификации текста на основе ключевых слов. Набор данных содержит текст 3 столбца, ключевые слова и условия cc, мне нужно извлечь ключевые слова…
26 ноя '20 в 11:33
0
ответов
Извлечение ключевых слов из научных отчетов
Я работаю в институте, который проводит исследования в области физики, и за эти годы накопилось много отчетов об этих исследованиях. Эти отчеты составлены на немецком языке и содержат некоторую метаинформацию, результаты экспериментов в табличной фо…
23 ноя '20 в 13:35
0
ответов
ООП-программирование на Python для парсинга веб-страниц и извлечения ключевых слов не работает из-за ошибок в синтаксисе кода [закрыто]
Я пытаюсь включить этот фрагмент кода в синтаксис ООП. Код хорошо работает вне схемы ООП. Мне нужно поместить неопределенные переменные, взятые из ранее вызванных функций, внутри объектов, чтобы он работал, но я не знаю, как этого добиться! Любая по…
16 фев '21 в 14:00
0
ответов
Извлеките ключевые слова из набора похожих предложений с помощью python
У меня есть список похожих предложений, и я хотел бы автоматически извлекать топ-n важных ключевых слов [длина одного слова] из всего набора этих предложений с помощью python. Эти предложения уже имеют нормализованную форму, так как они не содержат …
15 фев '21 в 15:27
0
ответов
Python Rake для извлечения ключевых слов
Я пытаюсь использовать грабли в своем наборе данных для извлечения ключевых слов и фраз. Однако у меня возникли проблемы с применением этого к моему фрейму данных. мой код выглядит следующим образом: df = pd.read_csv('_________') def rake_implement(…
05 апр '21 в 18:48
0
ответов
Какие возможные значения частей речи (pos) доступны в библиотеке pke?
Я использую библиотеки pke MultipartiteRank и PositionRank для извлечения ключевых слов из входящего текста. Я хотел изучить возможные значения, которые может иметь гиперпараметр pos. Я просмотрел библиотеку и не нашел никакой вспомогательной докуме…
19 апр '21 в 19:36
0
ответов
Импортировать документы DITA в Python
Я пытаюсь выполнить извлечение ключевых слов с помощью Rake-NLtk в python. С другой стороны, я должен работать с документами DITA (суффикс моих файлов - .dita). Не могли бы вы помочь мне здесь и подсказать, как мне импортировать документы DITA в кач…
15 июн '21 в 21:19