码迷,mamicode.com
首页 > 编程语言 > 详细

在linux服务器下部署python工程(爬虫)

时间:2017-07-13 20:26:02      阅读:381      评论:0      收藏:0      [点我收藏+]

标签:nbsp   invalid   内容   error   val   爬虫   最快   inf   https   

---恢复内容开始---

这两天 部署 这个 工程 ,真的是 心力交瘁惹。

如果有用到爬虫的话,python环境 先配好,如果是 python3的话 beautifulsoup 可以参见

linux安装python3.6 及 beautifulsoup

http://www.cnblogs.com/clover-xuqi/p/7155496.html

 

= = 正题:

简单来说 ,只要 把整个工程文件夹,考过来,用 命令行 python3  main.py 就好了

请先保证,能在自己电脑上 能用命令行让工程跑起来。。。windows下 cmd 内 python3不能用的, 请百度,把python3 丢进环境变量里。

好了。

在 windows下 能跑起来了, 丢服务器。。

python3 main.py 

如果能动,就哦了。。如果 遇到以下问题。。请参照着解决。

1、except Exception, x   invalid syntax错误 还特么 指着那个 逗号。 

  解决方法: except Exception as x:  把逗号 改成as 。。

2、<urlopen error unknown url type: https>

  解决方法: 把 url 里的 https 改成 http。。相信我,这样 解决 最快!!!!。。我开始 也不肯认输的。现实教我做人了。。。如果非要用 https 参照4

3、if(data[‘cont‘] == ‘No Update Information!\n\n‘):
TypeError: tuple indices must be integers or slices, not str

  解决方法:好好的 字典 说特么 找不到东西 就找不到东西。。问题十有八九 是在 返回来的字典 特么是null。为啥是null呢。。自己一步步检查把。。

       我通过。40+的print 成功定位到 下载器 下不出页面 是 url https 错误,没错 就是2.好了。

4、对,不得不用https协议的。。网站。。orz。。可以先试一下 python3下能不能 import ssl 如果不行,恭喜,我们都是 ssl 缺失引起的悲剧。。

  解决方法:http://www.cnblogs.com/yuechaotian/archive/2013/06/03/3115472.html

  击掌~

 

在linux服务器下部署python工程(爬虫)

标签:nbsp   invalid   内容   error   val   爬虫   最快   inf   https   

原文地址:http://www.cnblogs.com/clover-xuqi/p/7162085.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!