Описание тега beautifulsoup

Beautiful Soup - это пакет Python для анализа HTML/XML. Последней версией этого пакета является версия 4, импортированная как bs4.

Beautiful Soup - это библиотека Python для извлечения данных из файлов HTML и XML. Он может использовать стандартный HTML-парсер Python, а также другие парсеры, такие как lxml или html5lib. Он предоставляет простые идиоматические способы навигации, поиска и изменения дерева синтаксического анализа. Обычно это экономит программистам часы или дни работы.

Beautiful Soup 4 (широко известный какbs4(после названия модуля Python) - это последняя версия Beautiful Soup, которая в основном обратно совместима с Beautiful Soup 3.

Начиная с версии 4.7.0, Beautiful Soup поддерживает широкий спектр селекторов CSS4, добавляя к уже богатой коллекции инструментов для выбора элементов HTML/XML.

Примечание: Beautiful Soup 3 работает только на Python 2.x, а Beautiful Soup 4 работает как на Python 2 (2.7+), так и на Python 3.