Описание тега elementtree
ElementTree - это библиотека Python для создания и анализа XML.
1
ответ
Преобразование XML в Pandas Dataframe
XML-файл: <start> <Hit> <hits path="xxxxx" id="xx" title="xxx"> <hits path="aaaaa" id="aa" title="aaa"> </Hit> <Hit> <hits path="bbbbb" id="bb" title="bbb"> </Hit> <Hit> <hits path="qqqqq" id=…
27 авг '18 в 05:31
1
ответ
Etree.tostring LXML, экранирующий URL в атрибутах ссылки href
При использовании LXML для анализа html-документа, а затем при помощи etree.tostring() я замечаю, что амперсанды в ссылках преобразуются в html-экранированные сущности. Это разрыв связи по понятным причинам. Вот простой автономный пример проблемы: &…
22 дек '14 в 21:01
2
ответа
ImportError: нет модуля с именем elementtree.SimpleXMLWriter
В моем коде Python я пытаюсь отобразить вывод в формате XML. Для этого я использую XMLwriter, Но это показывает ошибку: Traceback (most recent call last): File "C:\Users\Ponmani\Desktop\test.cgi", line 8, in <module> from elementtree.SimpleXML…
19 сен '12 в 11:16
2
ответа
Как удалить атрибут из корневого элемента в Python xml etree ElementTree
Мой файл содержит следующие данные: Оригинал: <?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <changefreq>daily</changefreq> <loc>http://www.example.com<…
02 дек '16 в 04:52
2
ответа
Получить все дети из тега XML с помощью ElementTree
Я пытаюсь проанализировать XML-файл, используя ElementTree, и в какой-то момент я получаю только первый дочерний элемент вместо всех дочерних элементов внутри тега. Ниже приведена моя XML-структура:- <?xml version="1.0" encoding="UTF-8" standalon…
22 ноя '17 в 15:58
3
ответа
AttributeError: модуль 'copy' не имеет атрибута 'deepcopy'
Я на самом деле новичок в Python и BS4. И я решил создать скрипт, который будет чистить веб-сайт, если быть точным, oscarmini.com, код работал нормально до сегодняшнего дня, когда я хотел изменить его, я продолжаю получать ошибки, из-за того, что у …
10 июл '18 в 03:44
1
ответ
Удаление элемента, но не текста после него
У меня есть XML файл похож на этот: <root> <a>Some <b>bad</b> text <i>that</i> I <u>do <i>not</i></u> want to keep.</a> </root> Я хочу удалить весь текст в <b> или же <…
09 апр '14 в 15:45
2
ответа
Python getchildren() не работает для допустимого дерева XML
Если я запускаю следующий Python в файле XML (см. Внизу Q): import xml.etree.ElementTree as ET tree = ET.parse('C:\\temp\\test2.xml') print(tree.getchildren()) Я получаю ошибку: AttributeError: у объекта 'ElementTree' нет атрибута 'getchildren' Я за…
23 мар '18 в 20:13
2
ответа
Получить атрибут xml, используя python etree
Вот мой xml <Departments orgID="1234 " name="This is Demo Name"> <Department> . . </Department> <Department> . . </Department> </Departments> Я хочу получить атрибут этого XML с помощью orgID. предполагать orgID=1…
21 мар '14 в 07:46
1
ответ
Порядок установки атрибутов дерева элементов
Я пытаюсь написать скрипт Python для стандартизации общих файлов XML, используемых для настройки веб-сайтов и форм веб-сайтов. Однако, чтобы сделать это, я хотел бы либо сохранить исходный порядок атрибутов элементов, либо даже лучше изменить их зар…
10 янв '13 в 12:28
1
ответ
Разбор HTML-таблицы данных с тегами разрыва в lxml
Внешнее приложение добавляет теги разрыва в мои данные таблицы HTML, когда я копирую данные в ячейку из блокнота <tr> <td>3.7.4</td> <td>12133<br />43434<br />65465<br />66656</td> <td>test</t…
14 дек '16 в 02:57
1
ответ
Читать XML-файл на Python
Я использую ElementTree в Python, чтобы прочитать файл XML и получить некоторые значения. Проблема в том, что я успешно получил имена переменных, но я не могу прочитать значения, содержащиеся, например, в теге TABLE в теге DEFINITION. Вот мой код дл…
06 май '14 в 16:42
1
ответ
Изменить XML с помощью ElementTree
<grandParent> <parent> <child>Sam/Astronaut</child> </parent> </grandParent> Я хочу изменить вышеуказанный XML, добавив еще один дочерний тег в родительский тег. Я делаю что-то вроде этого.. tree = ET.parse("test.…
31 июл '14 в 20:46
2
ответа
Поиск по шаблону на любой вложенной глубине с использованием xml.etree.ElementTree
У меня есть группа файлов XML, которые содержат записи, такие как <group name="XXX common string"> <value val="12" description="a dozen"> <text>one less than a baker's dozen</text> </value> <value val="13" descriptio…
24 июл '15 в 07:57
1
ответ
Найти и отредактировать подэлемент в XML с помощью Python ElementTree
Поскольку файл XML, с которым я имею дело, содержит несовместимые подэлементы, у меня возникают некоторые трудности с поиском и редактированием определенного подэлемента, который не появляется в серии элементов, пока не будет дальше в файле. Я испол…
03 мар '13 в 18:00
2
ответа
Python ElementTree.Element отсутствует текст?
Итак, я анализирую этот XML-файл умеренного размера (около 27K строк). Не так далеко, я вижу неожиданное поведение от ElementTree.Element, где я получаю Element.text для одной записи, но не для следующей, но она есть в исходном XML, как вы можете ви…
05 май '18 в 19:15
1
ответ
Где ловить исключение в цикле "for"?
У меня есть некоторый код, используемый для анализа XML, который я хочу немного улучшить (в основном для учета искаженных файлов XML). try: import xml.etree.cElementTree as ET except: import xml.etree.ElementTree as ET context = ET.iterparse("myfile…
16 окт '14 в 15:52
1
ответ
Как я могу получить значение тега XML на основе значения другого тега XML?
Я застрял, работая с XML и классом ElementTree. У меня есть следующая структура XML: <workItem> <stringExtensions> <key>key1</key> <value>value1</value> </stringExtensions> <stringExtensions> <key&g…
22 дек '17 в 09:16
1
ответ
Согласованность элементов ElementTree
Я использую XML для описания ограничивающих рамок и намерен отфильтровать некоторые элементы XML-файлов. Типичный XML может выглядеть так: <annotation> <folder>original2</folder> <filename>beach146.jpg</filename> <pa…
24 авг '18 в 10:01
1
ответ
Python XML файл чтения
Я надеюсь, что кто-то может помочь. Я не могу прочитать файл XML и перепробовал много предложенных решений. Прежде всего, вот файл: <Program> <20180531 /> <20180601 /> <20180602 /> <20180603 /> <20180604 /> <20…
19 июн '18 в 22:29