Как очистить сайт WordPress с помощью красивого супа и получить все теги ( #)
Я пытаюсь найти все элементы # на определенной веб-странице, используя красивый суп.
source = " https://www.runinrabbit.com/"
def getPageContents(source):
req = requests.get(source)
print("req : ",req,type(req))
print("***************************")
content = Soup(req.text, 'html.parser')
print("content data",type(content),content)
return content
В качестве контента я просто получаю все остальное, кроме тегового значения.
Например: строки с тегами, как показано ниже, не выводятся в моей функции: getPageContents.
#marathoner, #winner, #runinrabbit, #topoathletic, #hartfordmarathon, #rabbitpro, #marathon, #olympictrials, #runnergirl, #winning, #finisher, #run, #running, #runner, #runnersofinstagram, #runnersnerscommunity, #r, #breezyback, #lightweight, #simple, #runinrabbit, #borntorunfree, #breezyback, #lightweight, #simple, #runinrabbit, #borntorunfree", #racerollcall, #racetime, #runfast, #goodluck, #RADrabbit, #rabbitELITE, #rabbitELITEtrail, #rabbitPRO, #runinrabbit, #borntorunfree"