Почему POS-теги занимают так много времени? Есть ли способ повысить скорость?
Класс POSTagger(объект): def init (self): проход
def pos_tag(self, sentences):
"""
input format: list of lists of words
e.g.: [['this', 'is', 'a', 'sentence'], ['this', 'is', 'another', 'one']]
output format: list of lists of tagged tokens. Each tagged tokens has a
form, a lemma, and a list of tags
e.g: [[('this', ['DT']), ('is', ['VB']), ('a',['DT']), ('sentence', ['NN'])],
[('this', ['DT']), ('is', ['VB']), ('another', ['DT']), ('one', ['CARD'])]]
"""
pos = [nltk.pos_tag(sentence) for sentence in sentences]
return pos
{ Я написал функцию для пометки POS, чтобы я мог выполнять сентиментальный анализ на 14500 строках, но это занимает много времени около 27 секунд, в то время как весь алгоритм для сентиментального анализа занимает 36 секунд. Есть ли способ сократить его время? }