import urllib.request import bs4 import re import os url="https://tieba.baidu.com/p/1988291937?fr=ala0&pstaala=1&tpl=5&isgod=0" html=urllib.request.ur ...
分类:
其他好文 时间:
2017-05-02 16:48:18
阅读次数:
160
import requests import re import time from bs4 import BeautifulSoup today = time.strftime('%Y-%m-%d',time.localtime(time.time())) one_url = 'http://hz... ...
分类:
编程语言 时间:
2017-04-26 13:07:59
阅读次数:
499
1 from bs4 import BeautifulSoup 2 import os 3 import requests 4 5 #获取页面内容 6 def getHtmlText(url, s='text'): 7 try: 8 r = requests.get(url, timeout=30)... ...
分类:
其他好文 时间:
2017-04-24 23:03:53
阅读次数:
365
import requests import os import re import re import urllib import urllib.parse from bs4 import BeautifulSoup count=0#小类的个数 all_url='http://category.d ...
分类:
其他好文 时间:
2017-04-22 14:39:50
阅读次数:
133
import requests from bs4 import BeautifulSoup import urllib.request import urllib.parse import os import re import sys j=0 keyword=input("请输入搜索信息:")#输 ...
分类:
其他好文 时间:
2017-04-22 14:37:35
阅读次数:
137
每20秒执行一次 每1分钟执行一次 整点执行一次 整分钟执行一次 整秒执行一次 每天指定时间点执行 ...
分类:
其他好文 时间:
2017-04-18 12:43:49
阅读次数:
238
import requests import bs4 import urllib.request import urllib import os hdr = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHT... ...
分类:
编程语言 时间:
2017-04-15 14:55:13
阅读次数:
151
有时我们需要在一个主工程中添加其他的子工程,用来对子工程进行编写修改或者是利用子工程中的库文件等等操作,这时候我们需要用到工程的嵌套。 步骤:(看图说话) 1.新建主工程,名为TestTTTT,新建一个static framework 工程,工程名为MyLibrary。把两个工程文件放到一个文件夹下 ...
分类:
移动开发 时间:
2017-04-13 12:52:56
阅读次数:
228
今天在学习python,于是自己动手写了一个简单的爬虫的例子,解析Html使用bs4,爬取的网页是没有反爬机制的,也没有代理 ...
分类:
编程语言 时间:
2017-04-05 17:40:00
阅读次数:
190