Был ли улучшен Soundex?

Кажется, что Soundex реализован в некоторых СУБД, но были ли какие-либо алгоритмические улучшения, которые явно лучше, чем текущая реализация Soundex?

3 ответа

Решение

Да. Как указывает Википедия, есть Метафон и Двойной Метафон, NYSIIS и многое другое.

Имейте в виду, что это работает только для английского языка, который имеет свои специфические проблемы с орфографией. Это вряд ли нужно для испанского, и не имеет смысла для китайского / мандарина.

Я не знаю о "определенно лучше", но вы можете посмотреть на Metaphone (и его варианты) и Caverphone. См., Например, http://www.atomodo.com/code/double-metaphone где есть реализация "Двойного метафона" для использования с MYSQL.

Metaphone 3 - это третье поколение алгоритма Metaphone. Это повышает точность фонетического кодирования с 89% Double Metaphone до 98%, что проверено на базе данных наиболее распространенных английских слов, а также имен и неанглоязычных слов, знакомых в Северной Америке. Это производит чрезвычайно надежное фонетическое кодирование для американского произношения.

Metaphone 3 был разработан и разработан Лоуренсом Филипсом, который разработал и разработал оригинальные алгоритмы Metaphone и Double Metaphone.

Другие вопросы по тегам