Как остановить CSV-файл с помощью PorterStemmer в Python?
Я недавно делаю проект в NLP с использованием Python. где мне нужно предварительно обработать CSV-файл, который содержит текст с множеством строк и столбцов. Я смог получить только простые предложения. И не смог остановить сразу весь CSV-файл. Как я могу это сделать?? при попытке остановить простой CSV-файл я получаю сообщение об ошибке
import csv
from nltk import PorterStemmer
port = PorterStemmer()
with open('status.csv', 'rb') as f:
reader = csv.reader(f)
for row in reader:
print(port.stem(row))
1 ответ
Итак, вам нужно сделать несколько шагов.
#Part 1
>>> import nltk
>>> from nltk import PorterStemmer
>>> test = 'this sentence is just a tester set of words'
>>> test_tokenize = nltk.word_tokenize(test)
>>> test_tokenize
['this', 'sentence', 'is', 'just', 'a', 'tester', 'set', 'of', 'words']
>>> port = PorterStemmer()
>>> for word in test_tokenize:
... print port.stem(word)
...
thi
sentenc
is
just
a
tester
set
of
word
#Part 2
with open('status.csv', 'rb') as f:
reader = csv.reader(f)
for row in reader:
#reference the column where the text is located
#text = row[column_index_for_text]
#then just complete the steps in part 1 to get the stemmed words