Сценарий Python для чтения метафайла LANDSAT XML
Мне нужно получить идентификатор сцены для нескольких изображений Landsat. Метаданные для изображений содержатся в файле XML:
<?xml version="1.0"?>
<searchResponse xsi:schemaLocation="http://upe.ldcm.usgs.gov/schema/metadata
http://earthexplorer.usgs.gov/EE/metadata.xsd"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xmlns="http://upe.ldcm.usgs.gov/schema/metadata">
<metaData>
<browseAvailable>Y</browseAvailable
<browseURL>http://earthexplorer.usgs.gov/browse/tm/146/41/1998/LT51460411998300XXX01.jpg</browseURL>
<sceneID>LT51460411998300XXX01</sceneID>
<sensor>LANDSAT_TM</sensor>
<acquisitionDate>1998-10-27</acquisitionDate>
<dateUpdated>2012-07-31</dateUpdated>
<path>146</path>
<row>41</row>
<...>
</metaData>
<metaData>
<sceneID>LT51460411998300XXX01</sceneID>
<sensor>LANDSAT_TM</sensor>
<acquisitionDate>1998-10-27</acquisitionDate>
<dateUpdated>2012-07-31</dateUpdated>
<path>146</path>
<row>41</row>
<...>
<etc etc>
Следующий код перечислит все узлы в metaData (browseAvailable, browseURL, sceneID), но я действительно хочу получить список sceneID.
#!/usr/bin/python
#import os
#import sys
from xml.dom.minidom import parse
import xml.etree.ElementTree as ET
#import grass.script as grass
tree = ET.parse('C:/Users/Simon/Documents/tif/Metadata/metadata_test1.xml')
root = tree.getroot()
for metadata in root:
for data in metadata:
sceneID = data.text
grass.message('data -> %s' % (sceneID))
Я попытался использовать инструменты, описанные в Python xml.etree.ElementTree, но безуспешно. Может ли кто-нибудь помочь мне адаптировать приведенный выше код для возврата только sceneID?
1 ответ
Решение
Попробуй это:
#!/usr/bin/python
from xml.dom.minidom import parse
dom = parse('C:/Users/Simon/Documents/tif/Metadata/metadata_test1.xml')
ids = dom.getElementsByTagName('sceneID')
for id in ids:
print "%s" % id.childNodes[0].nodeValue