Есть ли способ генерировать слова, которые звучат похоже на данное словарное слово без использования корпуса?
Я пытаюсь использовать фонетические алгоритмы, такие как Soundex и / или Metaphone, чтобы генерировать слова, которые звучат аналогично данному словарному слову. Должен ли я иметь корпус всех словарных слов для этого? Есть ли другой способ генерировать слова, которые звучат похоже на данное слово без использования корпуса? Я пытаюсь сделать это на Python.
1 ответ
Если вы не используете корпус, то вам, вероятно, придется вручную определить набор правил, чтобы разбить слово на фонетические части, а затем найти список близких фонем. Это может генерировать похожие звучащие слова, но большинство не будет существовать. Если вы хотите генерировать близкие по звучанию слова, то вам обязательно нужен корпус.
Вы не уточнили цель своей задачи, но вас могут заинтересовать работы Уилла Лебена "Sounder I" (и II и III) и Jabberwocky.