Распознать сходство двух текстов в базе данных Python

Я получаю информацию в виде текста из нескольких разных каналов (телеграмма - пирограмма) и помещаю ее в базу данных. После небольшой обработки и изменения я поместил их в другую базу данных. Но в некоторых из этих мест есть почти похожие сообщения (до примерно 80-90% сходства). Я не хочу, чтобы в моей базе данных повторялся текст с сходством до 80%. Я использую язык программирования python и модуль MySql Connector для подключения к базе данных. Пожалуйста, помогите мне и предложите способ предотвратить эту проблему. Спасибо вам всем

0 ответов

Другие вопросы по тегам