Как заставить функцию PHP Similar_text() работать для японских символов (кандзи, катакана и хирагана)?

Я хочу использовать функцию Similar_text(), предоставляемую PHP для японских символов. Но, к сожалению, это дает неправильный ответ. Как я могу заставить это работать?

Например: similar_text('土橋勇樹', '東日刷株式')дает результат 3, но мы можем ясно видеть, что он должен быть 0

1 ответ

Решение

Вы захотите обработать возможные многобайтовые символы, образующие символы кандзи. Я не уверен на 100%, но я подозреваю, что Similar_text не поддерживает MB, и вам нужно подобное решение, которое может.

Эти ссылки показывают попытки людей обработать mb char аналогично функции php.

https://gist.github.com/soderlind/74a06f9408306cfc5de9

https://github.com/antalaron/mb-similar-text

Я лично не проверял это, но подход может быть правильным или вдохновить вас на написание пользовательской функции.

Также рассматривается в этом другом посте:

Как использовать подобный текст PHP-код на арабском языке

Другие вопросы по тегам