Описание тега html-xml-utils

1 ответ

html-xml-utils Получить конкретное значение <tr>

Я использую Xubuntu 16.04.2 с html-xml-utils Я пробовал эту команду hxnormalize -x site/sciz.html | hxselect 'table.vitals-table:first-child' но это не работает, ничего не выводит. В HTML есть около 3-5 таких таблиц. Делая это выводит все таблицы hx…
07 июл '17 в 08:06
1 ответ

Vbscript/UFT, как получить имя элемента Tag для проверки Xpath элементов тега

Прикрепленный образец XML, в прикрепленном XML я хочу проверить наличие элементов тега, например: PayloadList/IFXResp/IFX/GeneralStatus/StatusCode было бы здорово, если бы кто-нибудь мог помочь мне получить приведенный выше код xpath. Ищем код в vbs…
29 янв '19 в 09:28
1 ответ

Groovy: сохранение CR/LF атрибутов при сериализации XMLSlurper

Я новичок с отличным (несколько недель опыта). В настоящее время я пытаюсь обработать визуальную студию .vcproj файлы, использующие groovy: замена некоторых путей, которые будут найдены шаблонами регулярных выражений. Это прекрасно работает для меня…
1 ответ

Извлечение содержимого таблицы HTML на основе "thead"

Вот основная таблица HTML: &lt;table&gt; &lt;thead&gt; &lt;td class="foo"&gt;bar&lt;/td&gt; &lt;/thead&gt; &lt;tbody&gt; &lt;td&gt;rows&lt;/td&gt; … &lt;/tbody&gt; &lt;/table&gt; Предположим, в исходном файле есть несколько таких таблиц. Есть ли вар…
1 ответ

Разбор XML в Python

У меня большой XML-файл, и мне нужно отформатировать его, чтобы получить необходимые данные из определенных элементов в нем и распечатать только данные, необходимые в другой файл. В XML-файле у меня есть несколько текстовых тегов, относящихся к разн…
19 авг '17 в 00:29
1 ответ

Разбор локального HTML питона (lxml)

Я пытаюсь разобрать локальный HTML с lxml, но получаю сообщение об ошибке, но не знаю почему (заранее извините за плохой код, я новичок в этом). from lxml import etree, html from StringIO import StringIO parser = etree.HTMLParser() doc = etree.parse…
25 янв '16 в 11:28
2 ответа

Как я могу использовать hxselect для генерации результата массива?

Я использую hxselect для обработки HTML-файла в bash. В этом файле есть несколько элементов div, определенных с помощью класса.row. В bash я хочу извлечь эти "строки" в массив. (DIV многопоточны, поэтому простое чтение построчно не подходит.) Возмож…
05 янв '19 в 09:32
2 ответа

make[1]: ошибка exec(f77) (нет такого файла или каталога) в DragonFly BSD

Я получаю эту ошибку при попытке компиляции html-xml-utils-6.9 на DragonFly BSD. Самое смешное, когда делаешь grep -r f77 в исходном каталоге результат пуст. Так что никакой подобной опции нет в построенном Makefile после ./configure, Это мой вывод …
1 ответ

Средние селекторы игнорируются в hxselect

Я пытаюсь извлечь некоторый текст из веб-страницы, используя hxselect из html-xml-utils 7.4. По словам мужчины, hxselect будет принимать список CSS-селекторов, разделенных запятыми. У меня три селектора: /usr/local/bin/hxnormalize -x -i 0 -l 5000 ht…
29 янв '18 в 02:38
1 ответ

Ошибка пакета xml2csv: у объекта _IterParseIterator нет атрибута "следующий"

Я использую пакет xmlutils для преобразования XML-файла в CSV. Мой код следующий: from xmlutils.xml2csv import xml2csv as x input_path='/media/ishan/Local Disk/doc.xml' output_path='media/ishan/Local Disk/d.csv' data=x(input_path,output_path,encodin…
12 сен '16 в 11:10
1 ответ

Заменить что-либо внутри идентификатора HTML-тега

Поискал по всему Stackoverflow и Google, и самый близкий ответ: sed -i -e 's|&lt;element id="lastupdate"&gt;\([0-9]\{0,\}\)&lt;/element&gt;|&lt;element id="lastupdate"&gt;'"$(date -d @${contents})"'&lt;/element&gt;|g' /var/www/html/index.html работа…