nokogiri выберите параграф с текстовым соответствием
Итак, я написал скребок, и я пытаюсь получить только текст параграфа, который включает в себя на снегу чувствовать
Я пытаюсь вытащить это, но я не уверен, как заставить nokogiri вытащить абзац, который имеет что-то, совпадающее с текстом.
На данный момент у меня есть boards[:onthesnowfeel] = html.css(".reviewfold p").text
но это охватывает все параграфы. И не думайте, что параграфы будут в порядке все время. Так что не могу просто сделать [2] или что-то.
Но какой метод вы бы использовали для очистки абзаца, который соответствует тексту "На снегу чувствовать"
<div id="review" class="reviewfold">
<p>The <strong>Salomon A</strong><b>assassin</b> Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. </p>
<p><b>Approximate Weight</b>: Moew mix is pretty normal</p>
<p><strong>On Snow Feel: </strong>At vero eos et accusamus et iusto odio dignissimos ducimus qui blanditiis praesentium voluptatum.</p>
<p><strong>Powder: </strong>It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout. </p>
</div>
1 ответ
Решение
Вы могли бы использовать Enumerable#find
в сочетании с регулярным выражением =~
чтобы получить желаемый элемент содержимого.
html.css(".reviewfold p").find { |e| e.text =~ /On Snow Feel/ }.text