Как читать HTML-код, чтобы получить данные с Excel VBA
Я пытаюсь получить данные сома с веб-страницы с помощью Excel VBA.
HTML-код:
<div id="PriceLabel" class="skuPrice formRow">
<span class="skuPriceWrp">
<strong class="price red" id="skuPriceLabel" style="font-size: 20px;">
<span class="VAT">eks mva </span><br>
<span itemprop="price" id="SkuPriceUpdate">kr
<span itemprop="priceCurrency" content="NOK">151,20</span>
</span>
</strong>
<span> /
<span class="UOM" telephone="no">RL
</span>
</span>
</span>
<span class="skuUOMWrp">
<span id="showEachPrice" class="clear"></span>
</span>
<div class="formRow clear" id="divSkuSavePrice">
<span id="divSkuWhenYouBuy">
<span class="whenYouSave"></span>
</span>
</div>
</div>
То, что я хочу захватить, это ценность 151,20
, расположенный на первом "пролете".
Я пробовал: .document.getElementById("skuPriceLabel").getElementsByTagName("span")(0).innerText
Это дает значение "Eks mva" иногда и ошибку времени выполнения 424 (требуется объект) в другое время.
Я пытался использовать .document.getElementById("skuPriceLabel").getElementsByTagName("span")(1).innerText
а также .document.getElementById("skuPriceLabel").getElementsByTagName("span")(2).innerText
также, но те дают ошибку времени выполнения 424.
Может кто-нибудь, пожалуйста, дайте мне показать, как читать HTML-код, чтобы я мог видеть логику и знать, что искать и писать в следующий раз?
Мой полный код
Sub get_data_2()
'Source for this code is:
'http://stackru.com/questions/26613043/get-data-out-of-a-webpage-with-vba
Dim ie As Object
Dim sht As Worksheet
Dim SKU As String
Dim RowCount As Long
Set sht = Sheet8
Set ie = CreateObject("InternetExplorer.application")
RowCount = 1
'This just gives the columns a titel i row numer 1.
sht.Range("a" & RowCount) = "SKU" 'Column A is populated with SKU's to be looked up.
sht.Range("n" & RowCount) = "Price" 'Column N will be given the price of the SKU.
With ie
.Visible = True
.navigate "http://www.staples.no/"
Do While .Busy Or _
.readyState <> 4
DoEvents
Loop
Do
RowCount = RowCount + 1
SKU = sht.Range("a" & RowCount).Value
With ie 'fill in the searchbox and submit.
ie.document.all("searchKeywords").Value = SKU 'we can use 491215 as a SKU for this example.
ie.document.forms("searchForm").submit
Do While .Busy Or _
.readyState <> 4
DoEvents
Loop
'write the price to column N
sht.Range("n" & RowCount).Value = ie.document.getElementById("skuPriceLabel").getElementsByTagName("span")(1).getElementsByTagName("span")(0).innerText
End With
Loop While sht.Range("a" & RowCount + 1).Value <> "" 'Loop as long as column A has a SKU (till end of list).
End With
Set ie = Nothing
End Sub
1 ответ
Я бы сказал, что у вас есть 2 варианта:
1. ДОМ
.document.getElementById("skuPriceLabel").getElementsByTagName("span")(1).getElementsByTagName("span")(0).innerText
2. Regex
Используйте регулярное выражение: content=""NOK"">(.*?)<
с этой функцией
Public Function GetRegex(str As String, reg As String, Optional index As Integer) As String
On Error Resume Next
Set regex = CreateObject("VBScript.RegExp")
regex.Pattern = reg
regex.Global = True
If index < 0 Then index = 0
If regex.test(str) Then
Set matches = regex.Execute(str)
GetRegex = matches(index).SubMatches(0)
Exit Function
End If
GetRegex = ""
End Function