HTMLDocument.getElementsByTagName() не работает с именами не-HTML-тегов
Следующий код хорошо работает со стандартными тегами HTML, такими как div или p. Это удаляет первый накопленный тег:
Dim htmlDoc As HTMLDocument
Dim Node As IHTMLDOMNode
Set htmlDoc = New HTMLDocument
htmlDoc.body.innerHTML = strSomeData
Set Node = htmlDoc.getElementsByTagName(strSomeTagName).item(0)
Node.parentNode.removeChild Node
Но когда вы читаете HTMLDocument с именами тегов Angular, такими как article или main, или любыми другими нестандартными именами тегов html, getElementsByTagName() не может правильно прочитать DOM. Извлеченный.outerHTML извлеченного узла содержит только открывающий тег, а.innerHTML остается пустым. Когда вы удаляете такой узел, из HTMLDocument удаляется только открывающий тег, что разрушает всю логику структуры DOM.
Я что-то здесь упускаю?