标签:
之前解析字符串都是上正则,导致后来解析HTML/XML也习惯上正则,可是毕竟正则太底层的东西,对于这种有规律的文档,它不是一个好的选择。
后来发现了HTMLParser,感觉比正则好多了,正想深入学习一下,却发现了这个。
一比较然后我把以前代码里面的解析HTML/XML的正则全删了,改成BS来解析,所以在此推荐这个HTML/XML文档解析模块,当然它也可以用来修改文档。
至于示例和详细说明便不说了,文档写得不错,而且还是中文的。
python模块--BeautifulSoup <HTML/XML文档搜索模块>
标签:
原文地址:http://www.cnblogs.com/loopsun/p/5676914.html