标签:nbsp invalid 内容 error val 爬虫 最快 inf https
---恢复内容开始---
这两天 部署 这个 工程 ,真的是 心力交瘁惹。
如果有用到爬虫的话,python环境 先配好,如果是 python3的话 beautifulsoup 可以参见
linux安装python3.6 及 beautifulsoup
http://www.cnblogs.com/clover-xuqi/p/7155496.html
= = 正题:
简单来说 ,只要 把整个工程文件夹,考过来,用 命令行 python3 main.py 就好了
请先保证,能在自己电脑上 能用命令行让工程跑起来。。。windows下 cmd 内 python3不能用的, 请百度,把python3 丢进环境变量里。
好了。
在 windows下 能跑起来了, 丢服务器。。
python3 main.py
如果能动,就哦了。。如果 遇到以下问题。。请参照着解决。
1、except Exception, x invalid syntax错误 还特么 指着那个 逗号。
解决方法: except Exception as x: 把逗号 改成as 。。
2、<urlopen error unknown url type: https>
解决方法: 把 url 里的 https 改成 http。。相信我,这样 解决 最快!!!!。。我开始 也不肯认输的。现实教我做人了。。。如果非要用 https 参照4
3、if(data[‘cont‘] == ‘No Update Information!\n\n‘):
TypeError: tuple indices must be integers or slices, not str
解决方法:好好的 字典 说特么 找不到东西 就找不到东西。。问题十有八九 是在 返回来的字典 特么是null。为啥是null呢。。自己一步步检查把。。
我通过。40+的print 成功定位到 下载器 下不出页面 是 url https 错误,没错 就是2.好了。
4、对,不得不用https协议的。。网站。。orz。。可以先试一下 python3下能不能 import ssl 如果不行,恭喜,我们都是 ssl 缺失引起的悲剧。。
解决方法:http://www.cnblogs.com/yuechaotian/archive/2013/06/03/3115472.html
击掌~
标签:nbsp invalid 内容 error val 爬虫 最快 inf https
原文地址:http://www.cnblogs.com/clover-xuqi/p/7162085.html