Как читать HTML-код, чтобы получить данные с Excel VBA

Я пытаюсь получить данные сома с веб-страницы с помощью Excel VBA.

HTML-код:

<div id="PriceLabel" class="skuPrice formRow">
  <span class="skuPriceWrp">
    <strong class="price red" id="skuPriceLabel" style="font-size: 20px;"> 
       <span class="VAT">eks mva </span><br>
       <span itemprop="price" id="SkuPriceUpdate">kr 
         <span itemprop="priceCurrency" content="NOK">151,20</span>
       </span> 
     </strong>
     <span> /
       <span class="UOM" telephone="no">RL
       </span>
     </span>
  </span>
                        <span class="skuUOMWrp">
                            <span id="showEachPrice" class="clear"></span>
                        </span>
                        <div class="formRow clear" id="divSkuSavePrice">
                            <span id="divSkuWhenYouBuy">
                                <span class="whenYouSave"></span>&nbsp;
                            </span>

                        </div>

</div>

То, что я хочу захватить, это ценность 151,20 , расположенный на первом "пролете".

Я пробовал: .document.getElementById("skuPriceLabel").getElementsByTagName("span")(0).innerText

Это дает значение "Eks mva" иногда и ошибку времени выполнения 424 (требуется объект) в другое время.

Я пытался использовать .document.getElementById("skuPriceLabel").getElementsByTagName("span")(1).innerText а также .document.getElementById("skuPriceLabel").getElementsByTagName("span")(2).innerText также, но те дают ошибку времени выполнения 424.

Может кто-нибудь, пожалуйста, дайте мне показать, как читать HTML-код, чтобы я мог видеть логику и знать, что искать и писать в следующий раз?

Мой полный код

Sub get_data_2()
'Source for this code is:
'http://stackru.com/questions/26613043/get-data-out-of-a-webpage-with-vba

Dim ie As Object
Dim sht As Worksheet
Dim SKU As String
Dim RowCount As Long

Set sht = Sheet8
Set ie = CreateObject("InternetExplorer.application")

RowCount = 1
'This just gives the columns a titel i row numer 1.
sht.Range("a" & RowCount) = "SKU" 'Column A is populated with SKU's to be looked up.
sht.Range("n" & RowCount) = "Price" 'Column N will be given the price of the SKU.


With ie
    .Visible = True
    .navigate "http://www.staples.no/"

Do While .Busy Or _
    .readyState <> 4
    DoEvents
Loop

Do
    RowCount = RowCount + 1
    SKU = sht.Range("a" & RowCount).Value

    With ie 'fill in the searchbox and submit.
        ie.document.all("searchKeywords").Value = SKU 'we can use 491215 as a SKU for this example.
        ie.document.forms("searchForm").submit

        Do While .Busy Or _
            .readyState <> 4
            DoEvents
        Loop

        'write the price to column N
        sht.Range("n" & RowCount).Value = ie.document.getElementById("skuPriceLabel").getElementsByTagName("span")(1).getElementsByTagName("span")(0).innerText

    End With
Loop While sht.Range("a" & RowCount + 1).Value <> "" 'Loop as long as column A has a SKU (till end of list).
End With
Set ie = Nothing

End Sub

1 ответ

Я бы сказал, что у вас есть 2 варианта:

1. ДОМ

.document.getElementById("skuPriceLabel").getElementsByTagName("span")(1).getEl‌​ementsByTagName("span")(0).innerText

2. Regex

Используйте регулярное выражение: content=""NOK"">(.*?)< с этой функцией

Public Function GetRegex(str As String, reg As String, Optional index As Integer) As String
    On Error Resume Next
    Set regex = CreateObject("VBScript.RegExp")
    regex.Pattern = reg
    regex.Global = True
    If index < 0 Then index = 0
    If regex.test(str) Then
        Set matches = regex.Execute(str)
        GetRegex = matches(index).SubMatches(0)
        Exit Function
    End If
    GetRegex = ""
End Function
Другие вопросы по тегам