* BeautifulSoup 的.find(), .findAll() 函数原型 * 取得 span.green bsObj.findAll("span", {"class":"green"}) * 取得 h1,h2,h3,h4,h5,h6 bsObj.findAll({"h1","h2","h3 ...
分类:
编程语言 时间:
2018-08-05 11:53:39
阅读次数:
248
1. HtmlAgilityPack简介 网站中首先遇到的问题是爬虫和解析HTML的问题,一般情况在获取页面少量信息的情况下,我们可以使用正则来精确匹配目标。不过本身正则表达式就比较复杂,同时正则表达式的精确程度很难拿捏,太精确和原网页耦合太严重,页面代码稍改动就会使正则无效;太宽泛的正则由可能会匹 ...
分类:
Web程序 时间:
2018-07-25 22:02:07
阅读次数:
1051
``` /*! * \file Capture.cpp * * \author ranjiewen * \date 十一月 2016 * * http://www.cnblogs.com/tanfy/p/5552270.html 解析opencv自带人脸识别源码(……/opencv-3.1.0/sa... ...
分类:
其他好文 时间:
2018-07-14 21:58:11
阅读次数:
246
/*! * \file Capture.cpp * * \author ranjiewen * \date 十一月 2016 * * http://www.cnblogs.com/tanfy/p/5552270.html 解析opencv自带人脸识别源码(……/opencv-3.1.0/sample... ...
分类:
其他好文 时间:
2018-07-14 21:56:26
阅读次数:
257
什么是scrapy? Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,简单的理解它既是一个强大的爬虫框架 为什么要用这个框架? 因为它的功能强大: - 应用twisted,下载页面,实现并发效果 - HTML解析对象,自带lxml - 可以设置代理 - 可以设置延迟下载 - 可以 ...
分类:
编程语言 时间:
2018-07-13 01:12:11
阅读次数:
293
一、浏览器渲染过程 浏览器的渲染过程分为以下几个步骤:1.将HTML解析成DOM树 2. 将CSS解析成 CSS Rule Tree 3. 根据DOM树和CSSOM来构造 Rendering Tree 4.再下一步就是绘制,即遍历render树,并使用UI后端层绘制每个节点 相关概念说明: DOM ...
分类:
其他好文 时间:
2018-07-06 16:00:23
阅读次数:
207
Beautiifulsoup Beautiful Soup 是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。BeautifulSoup 用来解析 HTML 比较简单,API非常人性化,支持CSS选择器、Python标准库中的HTML解析器,也支持 lxml 的 ...
分类:
编程语言 时间:
2018-07-03 00:17:57
阅读次数:
1155
使用Beautiful Soup Beautiful Soup在解析时实际上依赖解析器,它除了支持Python标准库中的HTML解析器外,还支持一些第三方解析器(比如lxml)。 解析器 使用方法 优势 劣势 Python标准库 BeautifulSoup(markup, "html.parser" ...
分类:
其他好文 时间:
2018-07-01 10:28:45
阅读次数:
198
刚接触nodejs,做个东西练下手,通过nodejs直接转发整站,原本想把内容全翻译成英文,但google对流量行审查,被封IP,所以就没啥用了, 效果像这样 ...
分类:
Web程序 时间:
2018-06-29 18:32:31
阅读次数:
232
模板语法介绍 Vue.js使用了基于HTML的模板语法,允许开发者声明式地将dom绑定至底层Vue实例的数据。所有Vue.js的模板都是合法的HTML,所以能被遵循规范的浏览器和HTML解析器解析。 在底层的实现上,Vue将模板编译成虚拟dom渲染函数。结合响应式系统,Vue能够智能的重新计算出最少 ...
分类:
其他好文 时间:
2018-06-27 18:57:24
阅读次数:
483