Описание тега hpricot
Hpricot - это библиотека Ruby, предназначенная для анализа HTML. До выпуска Nokogiri, конкурирующего парсера HTML и css, Hpricot был де-факто парсером HTML для сообщества ruby.
1
ответ
Что такое Ruby Hpricot в Нокогири?
Я пытаюсь изменить сценарий ruby, чтобы сделать его более удобным для переноса. К сожалению, hpricot кажется немного сложным для установки на MS Windows, и я хочу избежать этого. Мои навыки рубина однако минимальны (или меньше). Как мне заменить это…
14 авг '12 в 15:09
3
ответа
Hpricot CSS Класс поиска
Я работаю над кодом, который очищает страницу для двух классов CSS на странице. Для этого я просто использую метод поиска Hpricot: webpage.search("body").search("div.first_class | div.second_class") ... для каждого найденного элемента я создаю объек…
12 июл '09 в 22:17
2
ответа
Как вставить узел DOM с определенным символьным индексом в существующий узел (с помощью Hpricot или аналогичной библиотеки Ruby)
Предположим, у меня есть этот HTML: html = <div>Four score and seven years ago</div> Как лучше всего вставить (скажем) тег привязки после слова "оценка"? Примечание: я хочу сделать это с точки зрения манипулирования DOM (например, с Hpri…
01 сен '09 в 22:09
1
ответ
hpricot добавить атрибут в тег HTML?
Может кто-нибудь объяснить, как добавить пользовательский атрибут в тег HTML, используя Ruby с гемом Hpricot? У меня есть тег, который выглядит так: <div class="test" id="tag1" style=""> и я хочу добавить пользовательский целочисленный атрибут…
09 авг '10 в 02:36
4
ответа
Как мне выполнить поиск регулярных выражений в Nokogiri для текста, который соответствует определенному началу?
Дано: require 'rubygems' require 'nokogiri' value = Nokogiri::HTML.parse(<<-HTML_END) "<html> <body> <p id='para-1'>A</p> <div class='block' id='X1'> <h1>Foo</h1> <p id='para-2'>B</p> </…
12 окт '09 в 18:00
1
ответ
Ruby: компьютерный стиль для веб-страницы
Я использую Hpricot для анализа html-страницы, но мне нужно получить вычисленные стили для каждого элемента. Например, если у меня есть элемент h1 Hpricot, а внешний CSS для страницы имеет фоновое изображение, определенное для h1, как я могу узнать,…
21 июн '10 в 07:22
1
ответ
Почему поиск xPath работает в REXML, а не в Hpricot?
Я использую Rails 3.2 и Hpricot. Я хотел бы найти элемент XML по содержимому его дочернего элемента и преобразовать его в объект Ruby, который позже будет отображен. Другими словами, я хотел бы найти ‘vehicle’ элемент, где его ребенок ‘line_number’ …
26 июл '12 в 08:18
2
ответа
Разобрать XML с помощью hpricot, получить атрибуты
Мой xml: http://www.google.ru/ig/api?weather=Chelyabinsk <forecast_information> <city data="Chelyabinsk, Province of Chelyabinsk"/> </forecast_information> Как получить данные города, например? Не inner_html, просто атрибуты, такие…
20 окт '09 в 13:18
6
ответов
Как найти значение элемента href в теге<a>с помощью ruby
Моя цель - найти первый результат в результатах поиска Google и собрать ссылку на сайт, поэтому я создал этот скрипт: require 'hpricot' require 'open-uri' require 'mechanize' query = gets.chomp agent = Mechanize.new page = agent.get("http://www.goog…
05 апр '11 в 13:58
2
ответа
hpricot-недопустимая байтовая последовательность в UTF-8
Я уже провел некоторые поиски, но ничего из этого не может решить эту странную, неожиданную проблему. Просто посмотрите на код удара: require 'open-uri' require 'hpricot' doc = Hpricot(open("http://www.baidu.com/")) #this web page's encoding is GB23…
01 авг '11 в 13:39
0
ответов
Hpricot: прекратить автоматическое исправление HTML
Рассмотрим следующий пример (пример данных): doc = Hpricot("<a><table><tr><td>LOREM IPSUM</td></tr></table></a>") это превращает его в <a></a><table><tr><td>LOREM IPSUM<…
15 мар '11 в 12:05
1
ответ
Разбор HTML с Hpricot & Ruby - получить самый внутренний html?
Я смотрю, чтобы разобрать некоторые старые HTML, который имеет множество посторонних тегов, которые можно сделать с помощью CSS сейчас - <b>, <font>и т. д. Я использую Hpricot для его анализа, но я хочу получить самый внутренний "inner_h…
09 окт '10 в 00:41
3
ответа
Как получить все изображения, PDF и другие файлы ссылки с веб-страницы?
Мне нужно разработать приложение Ruby on Rails, которое выбирает все ссылки на файлы изображений, pdf, cgi и т. Д. С веб-страницы.
04 янв '12 в 06:06
1
ответ
hpricot, использующий Java?
Я только что заметил, что много кода hpricot написано на Java... http://img697.imageshack.us/img697/7447/picture2yw.png Я слышал, что при обработке регулярных выражений JRuby работает намного лучше, чем native ruby. Может быть, просто активированы к…
11 май '10 в 22:10
2
ответа
Ошибка Hpricot при разборе специальных символов в URI
Я работаю над сценарием ruby, чтобы получить исторические цены на акции от Yahoo, используя Hpricot для анализа страниц. Это в основном просто: URL-адрес " http://finance.yahoo.com/q/hp?s= TickerSymbol" Например, для поиска в Google я бы использовал…
06 фев '10 в 23:42
3
ответа
Ruby Hpricot RegEx заменяет <BR>на <P>
Может кто-нибудь сказать мне, как конвертировать эту строку Javascript в Ruby с помощью Hpricot & RegEx? // Replace all doubled-up <BR> tags with <P> tags, and remove fonts. var pattern = new RegExp ("<br/?>[ \r\n\s]*<br/?>",…
09 авг '10 в 00:49
1
ответ
Ruby Hpricot XML-анализ документа ARIN
Я пытаюсь разобрать этот документ ARIN XML. Я хочу получить атрибут "name" внутри тега orgRef, и он не делает то, что я ожидал, когда я анализирую его с помощью Hpricot <?xml version='1.0'?><?xml-stylesheet type='text/xsl' href='http://whoi…
28 мар '11 в 02:19
1
ответ
Hpricot parse image alt text
Я пытаюсь извлечь альтернативный текст из всех изображений на странице, используя Hpricot, но не могу понять, как это сделать. Кто-нибудь делал это раньше? Спасибо! Деннис
05 ноя '10 в 19:43
1
ответ
Hpricot и Rails
Я совершенно новичок в Ruby и Rails... на самом деле сегодня я создал свое первое приложение на Rails, которое делает HTTP-запрос для извлечения XML-документа, а затем выводит его на экран... что-то простое для начала... Ну, теперь мне нужно разобра…
24 авг '10 в 20:32
2
ответа
Не жадные поиски с Hpricot?
Я использую Hpricot для обхода пакета XML. Для каждого узла, в котором я нахожусь, я хочу получить список ближайших детей. Однако при использовании (current_node/:section) Я получаю ВСЕ потомки, а не только непосредственные дети. Как я могу обойти э…
10 июл '09 в 17:31