Описание тега nltk-book

0 ответов

Измените название любого штата, округа, региона или их аббревиатуры на название страны в Python NLTK или других пакетах

У меня есть список мест, в котором указаны штаты, города и страны, округа и регионы в сокращениях, а некоторые - полностью. Например, Нью-Йорк, Калифорния, Англия, Великобритания, США, Миннесота, Лондон, Брэдфорд и т. Д. Я хочу, чтобы все это было п…
1 ответ

Получение оценок METEOR для японского текста

Я хочу создать партитуру METEOR для нескольких японских струнных. Я импортировал nltk, wordnet а также omw но результаты не убеждают меня, что он работает правильно. from nltk.corpus import wordnet from nltk.translate.meteor_score import single_mete…
21 июл '21 в 22:41
1 ответ

Conditional Frequency Distribution

Hi :) I am really new to Python and NLP and now trying to go through the NLTK book from O'Reilly. I'm currently at a dead set with the task concerning plotting and tabulating with Conditional Frequency Distribution. The task is the following: "find …
29 июл '21 в 01:52
1 ответ

Построение модели языка Ngram на уровне символов с помощью NLTK

Я пытаюсь построить языковую модель на уровне персонажа с помощью функции NLTK KneserNeyInterpolated. У меня есть частотный список слов в фрейме данных pandas, где единственным столбцом является частота (само слово является индексом). Я определил, о…
31 июл '21 в 23:14
1 ответ

Получение смысловой основы для слов nltk semcor corpus

Я пробовал semcor corpus в nltk. Я нашел здесь этот код : >>> list(map(str, semcor.tagged_chunks(tag='both')[:3])) ['(DT The)', "(Lemma('group.n.01.group') (NE (NNP Fulton County Grand Jury)))", "(Lemma('state.v.01.say') (VB said))"] Я проб…
03 сен '21 в 12:18
0 ответов

Создание грамматики в NLTK

Я пишу грамматику cfg для библиотеки NLTK на Python. Мне нужна эта функция грамматики: N[PT=not, FL=<-exists x.(?flj& exists y.(?flj1 & ?fl))>, FRL=?frl, RL=?rl] -> P NN[FL=?fl, FLJ=flj, FRL=?frl, FLJ1=?flj1, RL=?rl] Результат такой…
13 ноя '21 в 16:49
0 ответов

Напишите код с помощью NLTK, который будет находить фразы с указанной пользователем последовательностью частей речи

Пример: пользователь запрашивает ADJ+NOUN, и программа дает ("Wonderful", "ADJ", "World", "Noun")
22 ноя '21 в 02:11
1 ответ

Общий подсчет частоты слов с использованием NLTK Python

При тестировании стандартного способа написания кода для подсчета общей частоты слов в предложении (подсчет количества раз появления одного и того же слова), используя NLTK с Python, я не получаю результата, программа не выводит результат. похоже, ч…
19 янв '22 в 00:17
1 ответ

Доступные языки NLTK для токенизации слов и предложений

Мне нужно понять, для каких языков возможна токенизация в NLTK. Я думаю, что мне нужно установить язык следующим образом: import nltk.data lang = "WHATEVER_LANGUAGE" tokenizer = nltk.data.load('nltk:tokenizers/punkt/'+lang+'.pickle') text = "somethi…
31 янв '22 в 20:17
2 ответа

Как прочитать следующие строки кода?

Извиняюсь за основной вопрос, так как я совсем новичок в теме. conlltags = [(word, pos, chunktag) for ((word,pos),chunktag) in zip(sentence, chunktags))] Не могли бы вы разбить приведенный выше код в формате, указанном ниже: for i in exampleSentence…
31 мар '21 в 20:14
3 ответа

Как мне записать это в функцию в Python 3?

Как бы я написал это в функцию, которая дает тот же результат? from nltk.book import text2 sorted([word.lower() for word in text2 if len(word)>4 and len(word)<12])
01 дек '21 в 14:56
0 ответов

Какой разбор более естественный, тот, который приводит к предпочтительному чтению предложения

У меня такие правила: и эти два возможных дерева синтаксического анализа: Меня задают следующий вопрос: Какой разбор более естественный, тот, который приводит к предпочтительному чтению предложения? Может ли кто-нибудь объяснить мне, что более естес…
05 янв '21 в 14:30
0 ответов

Ошибка загрузки NLTK (хост не отвечает)

это изображение (внизу вы можете найти ошибку) nltk.download() после этой команды появилось диалоговое окно, указанное выше, но как только я нажимаю «Загрузить», оно говорит, что хост не отвечает Ошибка загрузки •abc' из < https://raw.githubuserc…
29 ноя '22 в 19:50
0 ответов

NLTK, Prover9: DiscourseTester не проходит проверку информативности (informchk)

В настоящее время я работаю с DiscourseTester, реализованным в NLTK. У меня последняя версия NLTK (3.8.1) и я работаю с Python 3.8. DiscourseTester дает сбой, когда я устанавливаю informchk=True, но работает, если для него установлено значение False…
08 фев '23 в 11:59
0 ответов

Добавление прилагательных и предлогов в грамматику DRT

Как добавить прилагательные (например, белый) и предлоги (например, в) в грамматику NLTK DRT?grammars/book_grammars/drt.fcfgне содержит таких примеров. Спасибо.
07 июн '22 в 12:58
0 ответов

nltk.download не работает, показывая errorno 11001 getaddrinfo failed и

Когда я запускаю интерактивную установку в соответствии с руководством nltk, т.е. import nltk nltk.download() введите здесь описание изображения , так как произошла эта ошибка, я начинаю установку через прокси-сервер >>> nltk.set_proxy('htt…
22 фев '23 в 03:57
0 ответов

NLTK — объяснение противоречивого поведения disperson_plot

ПочемуahabиAhabесть ли разница в nltk дисперсии_плота? from nltk.book import ( text1 as mobydick ) mobydick.dispersion_plot(['starbuck', 'captain', 'ahab']) mobydick.dispersion_plot(['starbuck', 'captain', 'Ahab']) Среда NLTK: 3.8.1 Python: 3.9.13
23 июн '23 в 06:22
1 ответ

Лексический график дисперсии с nltk работает неправильно

я использовал код nltk, чтобы построить график лексической дисперсии. Как вы можете видеть в приведенном ниже коде (прошу прощения за беспорядочный импорт). Я взял текст для 4 локальных PDF-файлов, извлек текст и выполнил бит word_tokenize. Я также …
07 май '23 в 11:44