Чтение XML-файла в Pandas и преобразование в фрейм данных
Привет, я работаю с огромным XML-файлом. Я хочу извлечь значения из всех абстрактных тегов и нужно преобразовать в фрейм данных.
Я пытался с помощью следующего кода:
root=file1.getroot()
print(root)
for child in root:
if(child.tag=='Abstract'):
print(Abstract.text)
file1.findall()
--- может использоваться для извлечения всех значений [![введите описание изображения здесь][1]][1]
использоваться для извлечения данных из тегов. Любая помощь приветствуется.
XML-файл
<PubmedArticleSet>
<PubmedArticle>
<MedlineCitiation Status="In-Data-review" owner="NLM">
<PMID version=="1">12345</PMID>
<Date>
<Year>2012</Year>
<Month>9</Month>
</Date>
<Pagination>
<MedlinePgn>444-488</MedlinePgn>
</Pagination>
<Abstract>
<AbstarctText>This is the Text I need to grab</AbstractText>
</PubmedArticle>
<PubmedArticle>
<MedlineCitiation Status="In-Data-review" owner="NLM">
<PMID version=="1">12345</PMID>
<Date>
<Year>2012</Year>
<Month>9</Month>
</Date>
<Pagination>
<MedlinePgn>444-488</MedlinePgn>
</Pagination>
<Abstract>
<AbstarctText>This is the Text I need to grab</AbstractText>
</PubmedArticle>
</PubmedArticleSet>