码迷,mamicode.com
首页 > Web开发 > 详细

用IHTMLDocument2接口获取页面上想要的数据,代替正则表达式

时间:2018-03-20 15:52:13      阅读:204      评论:0      收藏:0      [点我收藏+]

标签:tst   ext   reac   innertext   line   seo   www.   []   页面   

原文:用IHTMLDocument2接口获取页面上想要的数据,代替正则表达式

原文发布时间为:2010-07-01 —— 来源于本人的百度文章 [由搬家工具导入]

1. 用 IHTMLDocument2::all 获得所有元素;
2. 用 IHTMLElementCollection::tags 获得标签为 span 的元素;
3. 用 IHTMLElement::className 获得 class 名为 EX 的元素;
4. 用 IHTMLElement::innerText 获得文本。

IHTMLDocument2 doc = new HTMLDocumentClass();
doc.write(new object[] { ie.OutString });
doc.close();
if (doc != null)
{
IHTMLElementCollection iec = (IHTMLElementCollection)doc.all.tags("dd");

foreach (IHTMLElement ii in iec)
{
if (ii.getAttribute("onmouseout", 0).ToString() != "")
{
Console.WriteLine(ii.innerText);
string str = ii.innerText;
}
}
}

用IHTMLDocument2接口获取页面上想要的数据,代替正则表达式

标签:tst   ext   reac   innertext   line   seo   www.   []   页面   

原文地址:https://www.cnblogs.com/lonelyxmas/p/8609616.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!