标签:表达 htm python库 正则表达 方法 提取 结合 str soup
Python和web初学 :屏幕抓取、CGI和mod_python
描述:
1、屏幕抓取:通过程序下载网页并提取其中的信息的过程。
方法:
1、使用正则表达式
2、结合程序Tidy(一个Python库)和XHTML解析
3、使用Beautiful Soup库
标签:表达 htm python库 正则表达 方法 提取 结合 str soup
原文地址:https://www.cnblogs.com/yinminbo/p/11371190.html