Разбор XHTML с XPATH с использованием Microsoft.XMLHTTP в VBScript
Я ищу, чтобы разобрать документ xhtml с Microsoft.XMLHTTP с XPATH в VBScript. У меня есть следующая структура документа xhtml. Как бы я получить массив URL-адресов?
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
<title>Local index</title>
</head>
<body>
<table>
<tr>
<td>
<a href="url1.html">url1</a><br/>
<a href="url2.html">url2</a><br/>
<a href="url3.html">url3</a>
</td><td>
<a href="url1-1.html">url1-1</a><br/>
<a href="url2-1.html">url2-1</a><br/>
<a href="url3-1.html">url3-1</a>
</td>
</tr>
</table>
</body>
</html>
1 ответ
Решение
Вы уверены, что вам нужно использовать устаревший идентификатор программы? Microsoft.XMLHTTP
? В наши дни как MSXML 3, так и MSXML 6 являются частью операционной системы и соответственно поддерживают пакеты обновлений с Windows XP. Что касается использования XPath и MSXML 3, вот пример:
Dim doc
Set doc = CreateObject("Msxml2.DOMDocument.3.0")
doc.validateOnParse = False
doc.resolveExternals = False
If doc.load("file.xml") Then
doc.setProperty "SelectionLanguage", "XPath"
doc.setProperty "SelectionNamespaces", "xmlns:xhtml='http://www.w3.org/1999/xhtml'"
For Each link In doc.selectNodes("//xhtml:a")
WScript.Echo(link.getAttribute("href") & ": " & link.text)
Next
Else
WScript.Echo(doc.parseError.reason)
End If