想想这么多年,也是没有好好梳理一下自己的知识体系,以至于总是会有书到用时方恨少的遗憾。 最近既然有学习的动力,干脆就趁着这份工作不是特别忙的机会,写一点东西吧,也理理自己的逻辑思维能力。 python有哪些库? 这个问题呢可以参照http://blog.csdn.net/python_wangjun ...
分类:
编程语言 时间:
2017-04-04 20:17:10
阅读次数:
185
# -*- coding: utf-8 -*-"""Created on Mon Apr 3 09:37:52 2017 @author: zuihaodaxuepaiming"""import bs4import requestsfrom bs4 import BeautifulSoup def ...
分类:
编程语言 时间:
2017-04-03 11:21:32
阅读次数:
425
读者可能会奇怪我标题怎么理成这个鬼样子,主要是单单写 lxml 与 bs4 这两个 py 模块名可能并不能一下引起大众的注意,一般讲到网页解析技术,提到的关键词更多的是 BeautifulSoup 和 xpath ,而它们各自所在的模块(python 中是叫做模块,但其他平台下更多地是称作库),很少 ...
分类:
Web程序 时间:
2017-04-01 16:49:58
阅读次数:
337
导入方式 1. 在“开始”中找到 “命令提示符”,右键以 管理员身份运行,输入"pip install Requests" (注意中间的空格)。 2.使用快捷键 "win + R" 打开 cmd,输入"pip install Requests"。 导入其他库例如bs4,NumPy 等方法同上. 终于 ...
分类:
其他好文 时间:
2017-03-31 13:22:01
阅读次数:
144
翻译自Quora问答 原题What are the best Python scripts you've ever written 译者:niithub 抓取大学同学的简历 那是我在班加罗尔的最后一年,为了获得每一位同学的手机号和家庭地址,我写了我人生中的第一个脚本,它可以从学校就业网站上下载我所有 ...
分类:
其他好文 时间:
2017-03-28 23:41:55
阅读次数:
242
网络爬虫使用总结:requests–bs4–re技术路线
网络爬虫使用总结:scrapy(5+2结构)技术路线
网络爬虫使用总结:展望(PhantomJS引入)
分类:
编程语言 时间:
2017-03-28 17:31:09
阅读次数:
238
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/#id4中文版BeautifulSoup库作用提取HTML和XML文档中的数据修改、导航、查找文档创建html_doc>>>html_doc="""...<html><head><title>TheDormouse‘sstory</title></head>...&l..
分类:
其他好文 时间:
2017-03-23 17:02:17
阅读次数:
162
声明:仅用于学习语法,请勿用于非法用途importurllib.requestimportrefrombs4importBeautifulSoup#-*-coding:utf-8-*-url=‘http://www.qiushibaike.com/hot/‘user_agent=‘Mozilla/4.0(compatible;MSIE5.5;WindowsNT)‘headers={‘User-Agent‘:user_agent}request=urllib.request..
分类:
编程语言 时间:
2017-03-15 19:29:06
阅读次数:
425
#!/usr/bin/env python # coding: UTF-8 # -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup #import pandas newurl='http://www.qiushiba ...
分类:
编程语言 时间:
2017-03-14 18:44:34
阅读次数:
165