НЛП: TypeError: уменьшить ожидаемые как минимум 2 аргумента, получил 1
import math, functools
def splitPairs(word):
return [(word[:i+1], word[i+1:]) for i in range(len(word))]
def segment(word):
if not word: return []
allSegmentations = [[first] + segment(rest)
for (first, rest) in splitPairs(word)]
return max(allSegmentations, key = wordSegFitness)
class OneGramDist(dict):
def __init__(self):
self.gramCount = 0
for line in open('Norvig Word Library.txt'):
(word, count) = line[:-1].split('\t')
self[word] = int(count)
self.gramCount += self[word]
def __call__(self, word):
if word in self:
return float(self[word]) / self.gramCount
else:
return 1.0/ self.gramCount
singleWordProb = OneGramDist()
def wordSegFitness(words):
return functools.reduce(lambda x,y: x+y),
(math.log10(singleWordProblem(w)) for w in words)
Я пытаюсь улучшить сегментацию слов в некоторых текстовых файлах, которые у меня есть. Некоторые слова в этих файлах объединены (например, 'howmuchdoesthecarcost
или же 'helloworld'
), и я запускаю наивный байесовский процесс, чтобы разделить слова на части.
Тем не менее, когда я запускаю что-то вроде segment("helloworld")
Я получаю следующую ошибку: TypeError: reduce expected at least 2 arguments, got 1
, Как я могу изменить аргументы в Reduce, не теряя эффективности wordSegFitness()
?