标签:style http os ar for 数据 sp c on
万事开头难,作为第一篇博客,学不来深入浅出,妙趣横生,但求老老实实把事情说明白。
事情起源于kaggle竞赛者很慷慨地在github上开放了源码,kaggle非常贴心地将这些优异的解决方案和实现整理出来。对于小白级数据工作者,如我,是临摹思路,学习代码的绝好机会。为了享受这场盛宴,我在windows下搭建了python环境。由于ML包依赖有点复杂,本文赘述一二。
常见ML的python lib有:numpy, matplotlib, scipy, scikit-learn.
方式一:
常用的windows下安装python第三方包的工具setuptools小巧而好用。它省略了安装python第三方包所需要的下载,解压,执行python **.py 等繁琐过程,默认到http://pypi.python.org/simple搜索第三方包并下载安装,类似于linux下的yun功能。
和yun一样,它也会检查依赖,因此numpy,matplotlib,scikit-learn,安装过程中都会报错。
方式二:
我选择手动安装:sourceforge提供了exe安装包,貌似不进行依赖检查,以上各个包可以直接安装。网上有观点说scikit-learn会依赖nose,这一点没进行确认。我直接先easy_install nose, 然后下载这三个包,并安装。
这样留下的后患是,在运行python代码时,会提示这些第三方包import *** 找不到。easy_install可以基本解决,如six。dateutil是个例外,并且sourceforge也没有提供安装包。
方式三:
此时,移步至dateutil: http://www.lfd.uci.edu/~gohlke/pythonlibs/#python-dateutil
pyparsing亦是:http://www.lfd.uci.edu/~gohlke/pythonlibs/#pyparsing
以上三种途径基本上可以获得所需要的第三方包。
标签:style http os ar for 数据 sp c on
原文地址:http://www.cnblogs.com/xiny/p/4008801.html