Возможно ли применить алгоритм Симхаша между документом тестирования и набором данных обучения?
( Как сравнить сходство документов с алгоритмом Симхаша?) По мере продвижения к этому вопросу, возможно ли, что мы сможем применить этот алгоритм при проверке сходства между тестовым документом и набором обучающего документа. также это осуществимый подход?