Описание тега nltk-book
2
ответа
Словарь неправильно сортирует в Python
Мой код должен выводить 10 лучших слов с самой высокой частотой в корпусе. Тем не менее, он дает вывод 10 случайных слов. from nltk.corpus import brown import operator brown_tagged_sentences = brown.tagged_sents(categories='news') fd=nltk.FreqDist(b…
10 сен '17 в 11:42
0
ответов
Как справиться со словами, которые имеют пробел между символами?
Я использую nltk.word_tokenize на языке дари. Проблема в том, что у нас есть пробел между одним словом.Например слово "زنده گی" что означает жизнь. И то же самое; у нас есть много других слов. Все слова, заканчивающиеся символом "ه" мы должны дать м…
20 сен '17 в 09:29
1
ответ
Python: AttributeError: объект 'NoneType' не имеет атрибута 'start'
Приведенный ниже код принадлежит регулярному выражению NLTK: import nltk nltk.download('punkt') from nltk.tokenize import word_tokenize from nltk.tokenize import sent_tokenize scene = "Hello how! how are you? what is your problem. Can I solve with 0…
27 ноя '18 в 15:11
2
ответа
Python, NLTK: NameError: имя 'load_parser' не определено
Я пытаюсь запустить этот пример из книги NLTK здесь: >>> from nltk import load_parser >>> cp = load_parser('grammars/book_grammars/sql0.fcfg') >>> query = 'What cities are located in China' >>> trees = list(cp.par…
20 май '17 в 15:29
2
ответа
"слово" отсутствует в словаре в корпусе со словами, показанными в одном списке только в библиотеке gensim
Привет, участники сообщества, В настоящее время я реализую алгоритм Word2Vec. Во-первых, я извлек данные (предложения), разбил и разделил предложения на токены (слова), удалил знаки препинания и сохранил токены в одном списке. Список в основном соде…
21 авг '18 в 09:23
0
ответов
span_tokenize дает объект генератора в качестве вывода
Я написал простой фрагмент кода, чтобы увидеть, как именно работает функция span_tokenize. Документацию по этому вопросу можно найти здесь: http://www.nltk.org/api/nltk.tokenize.html Вот мой кусок кода import nltk from nltk.tokenize.api import Strin…
15 мар '18 в 02:56
1
ответ
Объект 'str' не может быть вызван в NLTK
import re import nltk import pandas as pd from nltk.chunk import RegexpParser from textblob import TextBlob data = open('data.txt', 'r') data = data.read() # region Fetch Account Type chunkData = r"""DataChunk: {(<NNP><NNP>+<CD>+)}…
29 май '17 в 06:50
0
ответов
ntlk TypeError: ожидаемая строка или байтовоподобная
Когда я пытался использовать sent_tokenize из пакета nltk, у меня был TypeError: ожидаемая строка или байтовоподобный объект Вот мой код: import ntlk from ntlk.book import * from ntlk.tokenize import sent_tokenize print(sent_tokenize(text9)) Можете …
23 янв '18 в 21:33
0
ответов
Функция nltkpersion_plot() не работает. Имеет стиль линии "|" был удален из matplotlib?
Я пытаюсь нарисовать лексические графики дисперсии, используя функцию nltk дисперсии_плот (). Мой код from nltk.book import * text4.dispersion_plot(["freedom","citizens"]) В результате я получаю сюжет ] 1) После некоторого поиска в Google и прохожде…
27 сен '18 в 17:53
1
ответ
Нлтк pos_tag ошибка в windows анаконда
Хотя я хочу собирать POS-теги с помощью функции pos_tag, возникает следующая ошибка. Я включил все пакеты, необходимые для nltk. Версия nltk 3.3 и работает в среде conda. версия Python 3.6. все пакеты nltk загружаются с использованием функции загруз…
08 июн '18 в 12:31
1
ответ
Почему при построении грамматики, основанной на функциях, возникает ошибка "неверный синтаксис"?
Почему я получаю "неверный синтаксис" в строке с% start S? nltk.data.show_cfg('grammars/book_grammars/feat0.fcfg') % start S S -> NP[NUM=?n] VP[NUM=?n] # NP expansion productions NP[NUM=?n] -> PropN[NUM=?n] NP[NUM=?n] -> Det[NUM=?n] N[NUM=?…
21 дек '18 в 11:24
0
ответов
Получение сообщений об ошибках при импорте nltk
Я успешно смог установить nltk, и у меня также есть все необходимые компоненты. Тем не менее, я получаю сообщения об ошибках, подобные этим, при импорте nltk. >>> import nltk Traceback (most recent call last): File "<pyshell#9>", line…
17 июн '18 в 11:51
1
ответ
nltk "OMW" wordnet с арабским языком
Я работаю над python/nltk с (OMW) wordnet специально для арабского языка. Все функции отлично работают с английским языком, но я не могу выполнить ни одну из них, когда использую тег 'arb'. Единственное, что прекрасно работает, это извлечение lemma_…
18 июл '17 в 03:27
0
ответов
Функция nltk.TaggerI в книге Стивена Берда
В настоящее время я прохожу НЛП Стивена Берда с Python. У меня вопрос. Какова функция nltk.TaggerI? Это в главе 6, Пример 6-5. class ConsecutivePosTagger(nltk.TaggerI) Я надеюсь получить лучшее представление об этом. Спасибо
24 авг '17 в 07:40
1
ответ
Требуется практическое решение Python NLTK Inaugural Text Corpora
Я делаю курс в NLTK Python, который имеет практическую проблему (на Katacoda) на "Text Corpora", и он не принимает мое решение, упомянутое ниже. Застрял в этой проблеме с давних пор. Необходимо завершить этот практический курс, чтобы продолжить пред…
19 июл '18 в 05:21
0
ответов
Я хочу токенизировать некоторый текст, используя nltk, но он показывал ошибку?
Мой код указан ниже.Код: import nltk from nltk.tokenize import sent_tokenize,word_tokenize short_pos = open("/positive.txt","r").read() short_neg = open("/negative.txt","r").read() short_pos_words = word_tokenize(short_pos) short_neg_words = word_to…
07 сен '17 в 10:29
0
ответов
Поиск слова с максимальным количеством POS-тегов
Учитывая помеченный корпус, я пытаюсь найти слово с наиболее четкими тегами. А также, какие теги они есть. import nltk from nltk.corpus import brown from operator import itemgetter cfd = nltk.ConditionalFreqDist((word, tag) for word, tag in brown.ta…
23 фев '18 в 14:58
1
ответ
NLTK pos tagger создает разные теги для одного и того же слова. Кто-нибудь может объяснить это?
Слово RR помечено как NN в одном случае и NNP в другом. Также заявитель помечен как NN в одном случае и JJ в другом. Почему эта разница в одном и том же слове? Разве что-либо, начинающееся с заглавной буквы, не должно быть помечено как NNP? testb Ou…
14 мар '18 в 14:17
0
ответов
НЛТК: Какие предложения e3.simplify() упрощают функцию?
import nltk from nltk.sem.logic import * read_expr = nltk.sem.Expression.fromstring e1 = read_expr('\\x. exists y. love(x,y)') e2 = read_expr('pat') e3 = nltk.sem.ApplicationExpression(e1, e2) print(e3.simplify()) Выход: exists y.love(pat, y) Я хочу…
21 ноя '17 в 22:10
2
ответа
Как найти недостающий ресурс НЛТК?
Я новичок в программировании на Python, и моя цель - научиться использовать nltk book collection. Но, к сожалению, я не могу использовать какие-либо функции, и это показывает ошибку поиска с предложением использовать функцию nltk.download('genesis')…
25 фев '18 в 14:59