Чтение XML-файла в Pandas и преобразование в фрейм данных

Question

Чтение XML-файла в Pandas и преобразование в фрейм данных

Привет, я работаю с огромным XML-файлом. Я хочу извлечь значения из всех абстрактных тегов и нужно преобразовать в фрейм данных.

Я пытался с помощью следующего кода:

root=file1.getroot()   
print(root)    
for child in root:
    if(child.tag=='Abstract'):  
        print(Abstract.text)  

 file1.findall()

--- может использоваться для извлечения всех значений [![введите описание изображения здесь][1]][1]
использоваться для извлечения данных из тегов. Любая помощь приветствуется.

XML-файл

    <PubmedArticleSet>
       <PubmedArticle>
           <MedlineCitiation Status="In-Data-review" owner="NLM">
            <PMID version=="1">12345</PMID>
              <Date>
                <Year>2012</Year>
                 <Month>9</Month>
              </Date>
            <Pagination>
                   <MedlinePgn>444-488</MedlinePgn>
         </Pagination>
          <Abstract>
           <AbstarctText>This is the Text I need to grab</AbstractText>
        </PubmedArticle>
        <PubmedArticle>
       <MedlineCitiation Status="In-Data-review" owner="NLM">
        <PMID version=="1">12345</PMID>
          <Date>
            <Year>2012</Year>
             <Month>9</Month>
          </Date>
        <Pagination>
               <MedlinePgn>444-488</MedlinePgn>
     </Pagination>
      <Abstract>
       <AbstarctText>This is the Text I need to grab</AbstractText>
    </PubmedArticle>
    </PubmedArticleSet>

0

python-3.x pandas xml dataframe

Источник

user8874151 02 май '18 в 07:56

0 ответов

Другие вопросы по тегам python-3.x pandas xml dataframe