Как обнаружить гомофон

Я довольно плохо знаком с обработкой речи, но удивляюсь, как обнаруживаются гомофоны. Я нахожусь в поиске API, который дает сходство между двумя словами на основе того, как они произносятся.

например: "до" и "два" очень похожи с точки зрения того, как они звучат в отношении слов "к" и "от".

2 ответа

Возможно, вы захотите попробовать рассчитать расстояние редактирования не для исходных строк, а для произношения, как это доступно в словаре произношения CMU по адресу http://www.speech.cs.cmu.edu/cgi-bin/cmudict

Следующие слова используются для индексации слов по их английскому произношению Soundex или Metaphone. Вы можете использовать пакеты Python, такие как Fuzzy, которые реализуют несколько алгоритмов индексации.

import fuzzy
Другие вопросы по тегам