Как очистить сайт WordPress с помощью красивого супа и получить все теги ( #)

Я пытаюсь найти все элементы # на определенной веб-странице, используя красивый суп.

source = " https://www.runinrabbit.com/"

def getPageContents(source):

    req = requests.get(source)
    print("req : ",req,type(req))
    print("***************************")
    content = Soup(req.text, 'html.parser')
    print("content data",type(content),content)
    return content

В качестве контента я просто получаю все остальное, кроме тегового значения.

Например: строки с тегами, как показано ниже, не выводятся в моей функции: getPageContents.

#marathoner, #winner, #runinrabbit, #topoathletic, #hartfordmarathon, #rabbitpro, #marathon, #olympictrials, #runnergirl, #winning, #finisher, #run, #running, #runner, #runnersofinstagram, #runnersnerscommunity, #r, #breezyback, #lightweight, #simple, #runinrabbit, #borntorunfree, #breezyback, #lightweight, #simple, #runinrabbit, #borntorunfree", #racerollcall, #racetime, #runfast, #goodluck, #RADrabbit, #rabbitELITE, #rabbitELITEtrail, #rabbitPRO, #runinrabbit, #borntorunfree"

0 ответов

Другие вопросы по тегам