Описание тега beautifulsoup
Beautiful Soup - это библиотека Python для извлечения данных из файлов HTML и XML. Он может использовать стандартный HTML-парсер Python, а также другие парсеры, такие как lxml или html5lib. Он предоставляет простые идиоматические способы навигации, поиска и изменения дерева синтаксического анализа. Обычно это экономит программистам часы или дни работы.
Beautiful Soup 4 (широко известный какbs4
(после названия модуля Python) - это последняя версия Beautiful Soup, которая в основном обратно совместима с Beautiful Soup 3.
Начиная с версии 4.7.0, Beautiful Soup поддерживает широкий спектр селекторов CSS4, добавляя к уже богатой коллекции инструментов для выбора элементов HTML/XML.
Примечание: Beautiful Soup 3 работает только на Python 2.x, а Beautiful Soup 4 работает как на Python 2 (2.7+), так и на Python 3.