Как сохранить OWASP HTML sanitizer от ограничения длины строки?

Я должен поместить несколько 100000 очень старых HTML-документов в веб-приложение. Я видел отличные эффекты при использовании OWASP HTML Sanitizer и смог убедиться, что правильно санирован HTML создан. Моя единственная проблема в том, что HTML Sanitizer накладывает жесткое ограничение на максимальную длину строки. Если быть точным, то это максимум 250 байт на строку. К сожалению, это приводит к тому, что некоторые слова разделяются посередине, и это то же самое с отображаемым html (отмеченным кареткой):

This sentence here is perfectly ok. But in the next s entence there is an additional space in the word "sentence".

                                                     ^

Как я могу сказать дезинфицирующему средству не заканчивать линии слишком рано?

Поскольку некоторые строки из исходного html имеют размер 800 байт или более, было бы также полезно, если бы я мог сказать дезинфицирующему средству только вставить разрывы в пробел.

1 ответ

Решение

Это скорее не ответ, а скорее признание: эффект обрезания строк был вызван какой-то другой частью моего кода, которая накладывала ограничение длины строки на вывод.

Другие вопросы по тегам