НЛП: TypeError: уменьшить ожидаемые как минимум 2 аргумента, получил 1

import math, functools

def splitPairs(word):
   return [(word[:i+1], word[i+1:]) for i in range(len(word))]

def segment(word):
   if not word: return []
   allSegmentations = [[first] + segment(rest)
                       for (first, rest) in splitPairs(word)]
   return max(allSegmentations, key = wordSegFitness)

class OneGramDist(dict):
    def __init__(self):
        self.gramCount = 0
        for line in open('Norvig Word Library.txt'):
            (word, count) = line[:-1].split('\t')
            self[word] = int(count)
            self.gramCount += self[word]

    def __call__(self, word):
        if word in self:
            return float(self[word]) / self.gramCount
        else:
            return 1.0/ self.gramCount

singleWordProb = OneGramDist()

def wordSegFitness(words):
    return functools.reduce(lambda x,y: x+y),
    (math.log10(singleWordProblem(w)) for w in words)

Я пытаюсь улучшить сегментацию слов в некоторых текстовых файлах, которые у меня есть. Некоторые слова в этих файлах объединены (например, 'howmuchdoesthecarcost или же 'helloworld'), и я запускаю наивный байесовский процесс, чтобы разделить слова на части.

Тем не менее, когда я запускаю что-то вроде segment("helloworld")Я получаю следующую ошибку: TypeError: reduce expected at least 2 arguments, got 1, Как я могу изменить аргументы в Reduce, не теряя эффективности wordSegFitness()?

0 ответов

Другие вопросы по тегам