Как сопоставить предложения в двух одинаковых текстах?

У меня есть два одинаковых текста (на самом деле набор таких пар). Чтобы проиллюстрировать, в каком смысле они похожи: один из них представляет собой оригинальный письменный текст, другой получен путем распознавания речи устного чтения первого. Поэтому второй текст может иметь некоторые несоответствия (слова, не распознаваемые механизмом STT, вставки или пропуски говорящим, пропущенные знаки препинания и т. Д.), Но основная структура идентична. Мне нужны некоторые идеи или алгоритмы для автоматического сопоставления соответствующих частей двух текстов. В вопросе, который я задавал о сопоставлении соответствующих предложений, так как они, кажется, представляют собой естественные структурные подразделения, но любая другая возможность хороша.

0 ответов

Другие вопросы по тегам