Python xml2dict сложный xml

У меня есть огромный и сложный XML-документ, который я хотел разобрать в словарь (а затем в БД с sqlalchemy). Я хочу использовать xmltodict для этой задачи.
Однако, похоже, что xmltodict не может анализировать глубоко вложенный xml напрямую.

Мой MWE:

test.xml

<?xml version="1.0" encoding="UTF-8"?>
<ns1:tag-1>
    <ns2:tag-2 attrib1="value" attrib2="value">
        <ns3:tag-3 attrib3="value">blabla</ns3:tag-3>
    </ns2:tag-2>
</ns1:tag-1>

test.py

import xmltodict as x2d
with open('ESCIDOC_test.xml', encoding='utf-8') as purein:
    doc = x2d.parse(purein.read())
print(doc['ns1:tag-1']['ns2:tag-2']['@attrib2'])  # works
print(doc['ns1:tag-1']['ns2:tag-2']['ns3:tag-3']['#text'] # does not work, TypeError
ns3tree = doc['ns1:tag-1']['ns2:tag-2']['ns3:tag-3'] 
print(ns3tree['#text'])  # works

Почему мне нужно сначала присвоить его новой переменной, чтобы она работала? В любом случае весь xml анализируется, не так ли?

print(doc)
# OrderedDict([('ns1:tag-1', OrderedDict([('ns2:tag-2', OrderedDict([('@attrib1', 'value'), ('@attrib2', 'value'), ('ns3:tag-3', OrderedDict([('@attrib3', 'value'), ('#text', 'blabla')]))]))]))])

Это из-за возможных проблем с памятью? Есть ли более элегантный обходной путь?

1 ответ

Решение

Вы пропустили закрытие) на линии, которая не работает.

Я использовал python 3.5, скопировал ваши файлы, но добавил закрытие) и изменил ESCIDOC_test.xml на test.xml. Запустил его и все 3 оператора печати работали правильно (без TypeError).

Другие вопросы по тегам