php - использование SimpleXML для разбора файла OAI PMH
Я пытаюсь проанализировать этот файл: http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=ListRecords&metadataPrefix=oai_dc&set=afcecemc&from=2011-06-21&until=2011-06-21 с использованием SimpleXML.
Я могу получить все элементы, кроме тех, которые находятся внутри тега. Там написано, что тег пуст. Вот мой код
function getXMLfile($URL) {
$chDyn = curl_init();
curl_setopt ($chDyn, CURLOPT_URL, $URL);
curl_setopt($chDyn, CURLOPT_RETURNTRANSFER, 1);
$xml = curl_exec($chDyn);
curl_close($chDyn);
try {
$xmlObj = new SimpleXMLElement($xml);
}
catch (Exception $e) { echo $e; }
return $xmlObj;
}
$cdmURL = "http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=ListRecords&metadataPrefix=oai_dc&set=afcecemc";
$xmlObj = getXMLfile($cdmURL);
$xmlNode = $xmlObj->ListRecords;
foreach ($xmlNode->record as $rNode) {
var_dump($rNode->children());
}
Но результат такой:
[...]
["metadata"]=>
object(SimpleXMLElement)#8 (0) {
}
Этот элемент не пуст! Я знаю, что решение каким-то образом связано с использованием "пространств имен", но я не могу понять, как заставить его работать.
Любая помощь будет оценена! Благодарю.
1 ответ
Чтобы получить доступ к детям с их собственным пространством имен, вы должны сказать SimpleXMLElement
что вы хотите, чтобы дети не в языковом стандарте по умолчанию. Увидеть SimpleXMLElement::children
,
Документ, на который вы ссылаетесь, использует несколько пространств имен, так что, возможно, это немного сбивает с толку, если вы новичок в этом.
Ниже приведен пример кода, который расширяет ваш (и немного упрощает загрузку, но я думаю, вы понимаете это) для доступа к дочерним элементам внутри первого элемента записи (я нарушаю цикл):
$url = 'http://mdc.cbuc.cat/cgi-bin/oai.exe?verb=ListRecords&metadataPrefix=oai_dc&set=afcecemc&from=2011-06-21&until=2011-06-21';
$xmlObj = simplexml_load_file($url);
$xmlNode = $xmlObj->ListRecords;
foreach ($xmlNode->record as $rNode) {
var_dump($rNode->children());
var_dump($rNode->metadata->children('oai_dc', 1));
var_dump($rNode->metadata->children('oai_dc', 1)->dc->children('dc', 1));
break;
}
Это дает следующий вывод, который, я думаю, именно то, что вы ищете:
object(SimpleXMLElement)#7 (2) {
["header"]=>
object(SimpleXMLElement)#9 (3) {
["identifier"]=>
string(29) "oai:mdc.cbuc.cat:afcecemc/521"
["datestamp"]=>
string(10) "2011-06-21"
["setSpec"]=>
string(8) "afcecemc"
}
["metadata"]=>
object(SimpleXMLElement)#10 (0) {
}
}
object(SimpleXMLElement)#10 (1) {
["dc"]=>
object(SimpleXMLElement)#8 (0) {
}
}
object(SimpleXMLElement)#7 (12) {
["title"]=>
string(12) "Puig d'Assas"
["creator"]=>
string(26) "Gallardo i Garriga, Antoni"
["date"]=>
string(19) "[Entre 1912 i 1928]"
["relation"]=>
array(2) {
[0]=>
string(72) "Paper; gelatina i plata; positiu; blanc i negre; horitzontal; 12 x 17 cm"
[1]=>
string(27) "Estudi de la Masia Catalana"
}
["subject"]=>
string(9) "Muntanyes"
["coverage"]=>
string(32) "Puig d'Assas ; Osona ; Catalunya"
["description"]=>
array(2) {
[0]=>
string(2) "Bo"
[1]=>
string(163) "Títol atorgat pel catalogador. Informació extreta dels àlbums de l'EMC: Situació: Puig d'Assas. Facilitada per: Antoni Gallardo i Garriga. Facilitada en: 1928."
}
["publisher"]=>
string(33) "Centre Excursionista de Catalunya"
["source"]=>
string(29) "Memòria Digital de Catalunya"
["type"]=>
string(5) "Image"
["rights"]=>
string(49) "http://creativecommons.org/licenses/by-nc-nd/3.0/"
["identifier"]=>
string(35) "http://mdc.cbuc.cat/u?/afcecemc,521"
}