Почему POS-теги занимают так много времени? Есть ли способ повысить скорость?

Класс POSTagger(объект): def init (self): проход

def pos_tag(self, sentences):
    """
    input format: list of lists of words
        e.g.: [['this', 'is', 'a', 'sentence'], ['this', 'is', 'another', 'one']]
    output format: list of lists of tagged tokens. Each tagged tokens has a
    form, a lemma, and a list of tags
        e.g: [[('this', ['DT']), ('is', ['VB']), ('a',['DT']), ('sentence', ['NN'])],
                [('this',  ['DT']), ('is', ['VB']), ('another', ['DT']), ('one',  ['CARD'])]]
    """

    pos = [nltk.pos_tag(sentence) for sentence in sentences]
    return pos 

{ Я написал функцию для пометки POS, чтобы я мог выполнять сентиментальный анализ на 14500 строках, но это занимает много времени около 27 секунд, в то время как весь алгоритм для сентиментального анализа занимает 36 секунд. Есть ли способ сократить его время? }

0 ответов

Другие вопросы по тегам