Подобная читаемости библиотека JavaScript

Существует ли (на стороне клиента) библиотека JavaScript для выполнения загромождения HTML в стиле Readability / Instapaper? т.е. берет HTML для полной веб-страницы и снимает с него загромождение, удаляя заголовки, боковые панели и т. д., чтобы просто оставить основную статью, используя некоторую эвристику. Я ищу что-то вроде чистого (htmlPageString).

Я думаю, что сама читаемость реализована в JavaScript, но для этого нет библиотеки.

3 ответа

Решение

Вот читаемость, инкапсулированная в модуле узла: читаемость узла. Работает нормально, но не в каждом случае. Я сейчас ищу альтернативы.

Я думаю, что эта библиотека JavaScript соответствует тому, что вы ищете. Это отдельная версия библиотеки, используемая для создания Reader View в Firefox.

https://github.com/mozilla/readability

Согласно моему чтению, это встроенный javascript+JSON, который хранит список чтения пользователей в очереди в форме JSON. Он отслеживает запросы веб-страницы, а также время, дату и некоторую другую конкретную информацию.

Другие вопросы по тегам