码迷,mamicode.com
首页 > Windows程序 > 详细

C# 通过正则平衡组匹配scrip标签中的json数据

时间:2018-09-14 11:53:43      阅读:299      评论:0      收藏:0      [点我收藏+]

标签:line   技术分享   count   pat   alt   reg   多个   value   pac   

前段在HTML页面中抓数据时碰到的一些问题,有些数据直接隐藏在script标签中了。于是想到了平衡组,分享下。

 

先通过HTML Agility Pack (非常强大的HTML解析工具)得到具体的HTML内容,通过具体的路径匹配所有的script标签,然后获取你想要的某个script内容,如下图:

技术分享图片

 

开始通过平衡组匹配:

string pattern = @"(?isnx) \[ (?> \[(?<Open>) | \](?<-Open>) | ((?![\[\]]).)* )* (?(Open)(?!)) \]";
MatchCollection mc = Regex.Matches(content, pattern);

if (mc.Count > 0 && mc[0].Success) Console.WriteLine(mc[0].Value);

这里我只要第一个json数组,如果你想要匹配多个json直接遍历即可。

 

C# 通过正则平衡组匹配scrip标签中的json数据

标签:line   技术分享   count   pat   alt   reg   多个   value   pac   

原文地址:https://www.cnblogs.com/xiongtaotao/p/9645427.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!