Как сохранить OWASP HTML sanitizer от ограничения длины строки?
Я должен поместить несколько 100000 очень старых HTML-документов в веб-приложение. Я видел отличные эффекты при использовании OWASP HTML Sanitizer и смог убедиться, что правильно санирован HTML создан. Моя единственная проблема в том, что HTML Sanitizer накладывает жесткое ограничение на максимальную длину строки. Если быть точным, то это максимум 250 байт на строку. К сожалению, это приводит к тому, что некоторые слова разделяются посередине, и это то же самое с отображаемым html (отмеченным кареткой):
This sentence here is perfectly ok. But in the next s entence there is an additional space in the word "sentence".
^
Как я могу сказать дезинфицирующему средству не заканчивать линии слишком рано?
Поскольку некоторые строки из исходного html имеют размер 800 байт или более, было бы также полезно, если бы я мог сказать дезинфицирующему средству только вставить разрывы в пробел.
1 ответ
Это скорее не ответ, а скорее признание: эффект обрезания строк был вызван какой-то другой частью моего кода, которая накладывала ограничение длины строки на вывод.