Как заставить функцию PHP Similar_text() работать для японских символов (кандзи, катакана и хирагана)?
Я хочу использовать функцию Similar_text(), предоставляемую PHP для японских символов. Но, к сожалению, это дает неправильный ответ. Как я могу заставить это работать?
Например: similar_text('土橋勇樹', '東日刷株式')
дает результат 3, но мы можем ясно видеть, что он должен быть 0
1 ответ
Вы захотите обработать возможные многобайтовые символы, образующие символы кандзи. Я не уверен на 100%, но я подозреваю, что Similar_text не поддерживает MB, и вам нужно подобное решение, которое может.
Эти ссылки показывают попытки людей обработать mb char аналогично функции php.
https://gist.github.com/soderlind/74a06f9408306cfc5de9
https://github.com/antalaron/mb-similar-text
Я лично не проверял это, но подход может быть правильным или вдохновить вас на написание пользовательской функции.
Также рассматривается в этом другом посте: