Тестовый набор для двойного метафона?
Я перевел Double-Metaphone на ActionScript3, и я хочу протестировать его (очевидно) перед тем, как выпустить исходный код в... хм... открытый.
Я ищу длинный список имен с первичным и вторичным кодами. Google не находит ничего, кроме одного списка с парами имен (предположительно, они должны совпадать).
Спасибо
1 ответ
Вы можете найти чужую двойную метафонную реализацию, запустить ее в том же длинном списке слов и сравнить результаты с вашими собственными.
Для длинных списков слов, я люблю infochimps. У них есть много списков слов, например, это одно из 350000 английских слов или это одно из топонимов, и многие другие.
Вот реализации, с которыми вы можете сравнить свои результаты. Вот онлайн пример, за исключением того, что он тестирует только одно слово за раз - я думаю, вам придется скачать и запустить один из скриптов, чтобы протестировать большой список слов.
Для каждого слова будут возвращены два кода; вы, вероятно, захотите проверить, что оба возвращенных кода соответствуют кодам, возвращенным другой реализацией. Вы, вероятно, знаете, что здесь приведена эталонная реализация с полным исходным кодом, но в любом случае с ссылками на другие.