Описание тега hpricot

Hpricot - это библиотека Ruby, предназначенная для анализа HTML. До выпуска Nokogiri, конкурирующего парсера HTML и css, Hpricot был де-факто парсером HTML для сообщества ruby.
1 ответ

Что такое Ruby Hpricot в Нокогири?

Я пытаюсь изменить сценарий ruby, чтобы сделать его более удобным для переноса. К сожалению, hpricot кажется немного сложным для установки на MS Windows, и я хочу избежать этого. Мои навыки рубина однако минимальны (или меньше). Как мне заменить это…
14 авг '12 в 15:09
3 ответа

Hpricot CSS Класс поиска

Я работаю над кодом, который очищает страницу для двух классов CSS на странице. Для этого я просто использую метод поиска Hpricot: webpage.search("body").search("div.first_class | div.second_class") ... для каждого найденного элемента я создаю объек…
12 июл '09 в 22:17
2 ответа

Как вставить узел DOM с определенным символьным индексом в существующий узел (с помощью Hpricot или аналогичной библиотеки Ruby)

Предположим, у меня есть этот HTML: html = <div>Four score and seven years ago</div> Как лучше всего вставить (скажем) тег привязки после слова "оценка"? Примечание: я хочу сделать это с точки зрения манипулирования DOM (например, с Hpri…
01 сен '09 в 22:09
1 ответ

hpricot добавить атрибут в тег HTML?

Может кто-нибудь объяснить, как добавить пользовательский атрибут в тег HTML, используя Ruby с гемом Hpricot? У меня есть тег, который выглядит так: <div class="test" id="tag1" style=""> и я хочу добавить пользовательский целочисленный атрибут…
09 авг '10 в 02:36
4 ответа

Как мне выполнить поиск регулярных выражений в Nokogiri для текста, который соответствует определенному началу?

Дано: require 'rubygems' require 'nokogiri' value = Nokogiri::HTML.parse(<<-HTML_END) "<html> <body> <p id='para-1'>A</p> <div class='block' id='X1'> <h1>Foo</h1> <p id='para-2'>B</p> </…
12 окт '09 в 18:00
1 ответ

Ruby: компьютерный стиль для веб-страницы

Я использую Hpricot для анализа html-страницы, но мне нужно получить вычисленные стили для каждого элемента. Например, если у меня есть элемент h1 Hpricot, а внешний CSS для страницы имеет фоновое изображение, определенное для h1, как я могу узнать,…
21 июн '10 в 07:22
1 ответ

Почему поиск xPath работает в REXML, а не в Hpricot?

Я использую Rails 3.2 и Hpricot. Я хотел бы найти элемент XML по содержимому его дочернего элемента и преобразовать его в объект Ruby, который позже будет отображен. Другими словами, я хотел бы найти ‘vehicle’ элемент, где его ребенок ‘line_number’ …
26 июл '12 в 08:18
2 ответа

Разобрать XML с помощью hpricot, получить атрибуты

Мой xml: http://www.google.ru/ig/api?weather=Chelyabinsk <forecast_information> <city data="Chelyabinsk, Province of Chelyabinsk"/> </forecast_information> Как получить данные города, например? Не inner_html, просто атрибуты, такие…
20 окт '09 в 13:18
6 ответов

Как найти значение элемента href в теге<a>с помощью ruby

Моя цель - найти первый результат в результатах поиска Google и собрать ссылку на сайт, поэтому я создал этот скрипт: require 'hpricot' require 'open-uri' require 'mechanize' query = gets.chomp agent = Mechanize.new page = agent.get("http://www.goog…
2 ответа

hpricot-недопустимая байтовая последовательность в UTF-8

Я уже провел некоторые поиски, но ничего из этого не может решить эту странную, неожиданную проблему. Просто посмотрите на код удара: require 'open-uri' require 'hpricot' doc = Hpricot(open("http://www.baidu.com/")) #this web page's encoding is GB23…
01 авг '11 в 13:39
0 ответов

Hpricot: прекратить автоматическое исправление HTML

Рассмотрим следующий пример (пример данных): doc = Hpricot("&lt;a&gt;&lt;table&gt;&lt;tr&gt;&lt;td&gt;LOREM IPSUM&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;&lt;/a&gt;") это превращает его в &lt;a&gt;&lt;/a&gt;&lt;table&gt;&lt;tr&gt;&lt;td&gt;LOREM IPSUM&lt…
15 мар '11 в 12:05
1 ответ

Разбор HTML с Hpricot & Ruby - получить самый внутренний html?

Я смотрю, чтобы разобрать некоторые старые HTML, который имеет множество посторонних тегов, которые можно сделать с помощью CSS сейчас - &lt;b&gt;, &lt;font&gt;и т. д. Я использую Hpricot для его анализа, но я хочу получить самый внутренний "inner_h…
09 окт '10 в 00:41
3 ответа

Как получить все изображения, PDF и другие файлы ссылки с веб-страницы?

Мне нужно разработать приложение Ruby on Rails, которое выбирает все ссылки на файлы изображений, pdf, cgi и т. Д. С веб-страницы.
04 янв '12 в 06:06
1 ответ

hpricot, использующий Java?

Я только что заметил, что много кода hpricot написано на Java... http://img697.imageshack.us/img697/7447/picture2yw.png Я слышал, что при обработке регулярных выражений JRuby работает намного лучше, чем native ruby. Может быть, просто активированы к…
11 май '10 в 22:10
2 ответа

Ошибка Hpricot при разборе специальных символов в URI

Я работаю над сценарием ruby, чтобы получить исторические цены на акции от Yahoo, используя Hpricot для анализа страниц. Это в основном просто: URL-адрес " http://finance.yahoo.com/q/hp?s= TickerSymbol" Например, для поиска в Google я бы использовал…
06 фев '10 в 23:42
3 ответа

Ruby Hpricot RegEx заменяет <BR>на <P>

Может кто-нибудь сказать мне, как конвертировать эту строку Javascript в Ruby с помощью Hpricot & RegEx? // Replace all doubled-up &lt;BR&gt; tags with &lt;P&gt; tags, and remove fonts. var pattern = new RegExp ("&lt;br/?&gt;[ \r\n\s]*&lt;br/?&gt;",…
09 авг '10 в 00:49
1 ответ

Ruby Hpricot XML-анализ документа ARIN

Я пытаюсь разобрать этот документ ARIN XML. Я хочу получить атрибут "name" внутри тега orgRef, и он не делает то, что я ожидал, когда я анализирую его с помощью Hpricot &lt;?xml version='1.0'?&gt;&lt;?xml-stylesheet type='text/xsl' href='http://whoi…
28 мар '11 в 02:19
1 ответ

Hpricot parse image alt text

Я пытаюсь извлечь альтернативный текст из всех изображений на странице, используя Hpricot, но не могу понять, как это сделать. Кто-нибудь делал это раньше? Спасибо! Деннис
05 ноя '10 в 19:43
1 ответ

Hpricot и Rails

Я совершенно новичок в Ruby и Rails... на самом деле сегодня я создал свое первое приложение на Rails, которое делает HTTP-запрос для извлечения XML-документа, а затем выводит его на экран... что-то простое для начала... Ну, теперь мне нужно разобра…
24 авг '10 в 20:32
2 ответа

Не жадные поиски с Hpricot?

Я использую Hpricot для обхода пакета XML. Для каждого узла, в котором я нахожусь, я хочу получить список ближайших детей. Однако при использовании (current_node/:section) Я получаю ВСЕ потомки, а не только непосредственные дети. Как я могу обойти э…
10 июл '09 в 17:31