我已经将网页下载为html并存储在本地文件夹中。现在,我想用excel VBA宏读取相同的html文件并解析特定的标签。问题是:当我尝试从本地html文件读取并将整个文件数据分配为html时,html标签属性发生了变化。问题阅读带有html标签的文本文件,并将它们转换成htmldoc VBA
我无法获得正确的html属性,因此我无法解析它。当我尝试读取html,然后分配给一个html对象并将数据写回到一个文件中时,我看到下面的结果。这就是我无法正确解析td.classname =“detb”的原因。
为前:原标签的 一部分作为本地的HTML文件
Mar 13Mar 12Mar 11Mar 10Mar 09下面的数据类型,当我读文件,然后指定一个HTML对象,并显示/写回文件:
Mar 13Mar 12Mar 11Mar 10Mar 09代码:
Set MyBrowser = CreateObject("InternetExplorer.Application")
With MyBrowser
.navigate << html file path >>
.Visible = True
Set HTMLDoc = MyBrowser.document
Open myFilePrev2 For Output As #1
Write #1, HTMLDoc.body.innerHTML
Close #1
.Quit
End With
能否请你帮我。
干杯, 拉哈夫
2016-08-01
Raghavan