Подобная читаемости библиотека JavaScript
Существует ли (на стороне клиента) библиотека JavaScript для выполнения загромождения HTML в стиле Readability / Instapaper? т.е. берет HTML для полной веб-страницы и снимает с него загромождение, удаляя заголовки, боковые панели и т. д., чтобы просто оставить основную статью, используя некоторую эвристику. Я ищу что-то вроде чистого (htmlPageString).
Я думаю, что сама читаемость реализована в JavaScript, но для этого нет библиотеки.
3 ответа
Вот читаемость, инкапсулированная в модуле узла: читаемость узла. Работает нормально, но не в каждом случае. Я сейчас ищу альтернативы.
Я думаю, что эта библиотека JavaScript соответствует тому, что вы ищете. Это отдельная версия библиотеки, используемая для создания Reader View в Firefox.
Согласно моему чтению, это встроенный javascript+JSON, который хранит список чтения пользователей в очереди в форме JSON. Он отслеживает запросы веб-страницы, а также время, дату и некоторую другую конкретную информацию.