Как решить проблему сегментации слов, тега pos и анализа тональности в SnowNLP?

Я использую пакет SnowNLP для выполнения программы, затем я использовал следующий веб-сайт github, чтобы загрузить этот инструмент:

https://github.com/isnowfy/snownlp

В этом инструменте я видел, что он может выполнять 3 программы. Он включает в себя сегментацию слов, тег pos и анализ тональности.

Ниже приводится код сегментации слов.

from snownlp import seg
seg.train('data.txt')
seg.save('seg.marshal')

Ниже приведен код тега pos.

from snownlp import tag
tag.train('199801.txt')
tag.save('tag.marshal')

Ниже приведен код анализа настроений.

from snownlp import sentiment
sentiment.train('neg.txt', 'pos.txt')
sentiment.save('sentiment.marshal')

Эти программы можно тренировать. Я могу добавить дополнительные данные сегментации слов и данные тега pos для обучения, но у меня возникла проблема.

Я сослался на следующий веб-сайт, чтобы сделать это.

https://www.itread01.com/content/1541222413.html

Первый раз, когда я добавил какие-то данные, можно его обучить. Однако, когда я хочу добавить>30000 данных для его обучения, я получаю следующую информацию об ошибке:

Для тега Pos:

PS C:\ProgramData\Anaconda3\Lib\site-packages\snownlp\tag> python .\tag_execute_tools.py
Traceback (most recent call last):
  File ".\tag_execute_tools.py", line 8, in <module>
    tag.train('199801.txt')
  File "C:\ProgramData\Anaconda3\lib\site-packages\snownlp\tag\__init__.py", line 27, in train
    tagger.train(data)
  File "C:\ProgramData\Anaconda3\lib\site-packages\snownlp\utils\tnt.py", line 89, in train
    for word, tag in sentence:
ValueError: too many values to unpack (expected 2)
PS C:\ProgramData\Anaconda3\Lib\site-packages\snownlp\tag>

Для сегментации слов

PS C:\ProgramData\Anaconda3\Lib\site-packages\snownlp\seg> python .\seg_execute_tools.py
Traceback (most recent call last):
  File ".\seg_execute_tools.py", line 5, in <module>
    seg.train('data.txt')
  File "C:\ProgramData\Anaconda3\lib\site-packages\snownlp\seg\__init__.py", line 35, in train
    segger.train(fname)
  File "C:\ProgramData\Anaconda3\lib\site-packages\snownlp\seg\seg.py", line 35, in train
    self.segger.train(data)
  File "C:\ProgramData\Anaconda3\lib\site-packages\snownlp\seg\y09_2047.py", line 68, in train
    for word, tag in sentence:
ValueError: too many values to unpack (expected 2)
PS C:\ProgramData\Anaconda3\Lib\site-packages\snownlp\seg>

Не знаю, почему у меня такие проблемы.

Может кто-нибудь помочь мне? Спасибо.

0 ответов

Другие вопросы по тегам