标签:面向 时间 正则表达式 有趣 图形界面 list c++ ali 电子邮件
人生苦短,我用Python(转)
Python的特色
1.简单 2.易学 3.免费、开源 4.高层语言: 封装内存管理等 5.可移植性: 程序如果避免使用依赖于系统的特性,那么无需修改就可以在任何平台上运行 6.解释性: 直接从源代码运行程序,不再需要担心如何编译程序,使得程序更加易于移植。 7.面向对象: 支持面向过程的编程也支持面向对象的编程。 8.可扩展性: 需要保密或者高效的代码,可以用C或C++编写,然后在Python程序中使用它们。 9.可嵌入性: 可以把Python嵌入C/C++程序,从而向你的程序用户提供脚本功能。 10.丰富的库: 包括正则表达式、文档生成、单元测试、线程、数据库、网页浏览器、CGI、FTP、 电子邮件、XML、XML-RPC、HTML、WAV文件、密码系统、GUI(图形用户界面)、Tk和其他与系统有关的操作。 除了标准库以外,还有许多其他高质量的库,如wxPython、Twisted和Python图像库等等。 11.概括: Python确实是一种十分精彩又强大的语言。它合理地结合了高性能与使得编写程序简单有趣的特色。 12.规范的代码: Python采用强制缩进的方式使得代码具有极佳的可读性。
Python在大数据时代
让我们来看看,Python在数据分析领域的生态圈吧!
Numpy:矩阵计算与其它大多数框架的数据处理基础;
Scipy:科学计算库,提供了很多科学计算工具包和算法;
Matplotlab:专业画图工具,话说这个单词还是真是在Matlab之间插入了plot这个词形成的;
Pandas:提供类似于R语言的DataFrame操作,非常方便;
OpenCV:提供图像识别的很多方便的操作;
Orange:基于图形界面的机器学习程序,也可以用Python脚本来操作调用;
Scikit-Learn:前面说了,这是Python在机器学习领域里面的代表作。尤其是它的文档,完全可以当成机器学习的参考资料来阅读了,曾经我向朋友推荐的时候说,说过,把scikit-learn的文档当成佛经来读,假以时日,功力定会大增。
Theano:深度学习里面非常有名的一个框架了,也非常具有代表性。是其它很多框架的基础。
Keras:基于Theano进行了抽象,建议入门的话使用这个,搭积木一样地就可以弄个神经网络出来了。
NLTK:自然语言处理,提供的功能也很强大。
国内出品的Mxnet的Python接口
Spark之MLlib的Python接口Pyspark
H2o的Python接口
收费的Graph Create的Python接口
Google最近刚出的TensorFlow的Python接口
三星最近刚出的Veles,目前只提供Python接口
新的机器学习或深度学习框架,如果不提供Python接口的话,恐怕会难以推广吧。
上面列举的只是其中一部分,还有很多很多。当然,他们很多并非是用Python来实现,但都共同的提供了Python接口,甚至好几个都把Python当成了头等公民(First-Class)。
在此并非想说Python这门语言很强大或者复杂,而恰恰相反,得益于Python的简洁和包容。才让它在数据挖掘领域有如此的地位。
这便是生态圈的力量,不以个人的意志为转移。
对于想入门数据分析、数据挖掘、机器学习的朋友来说,Python是你值得花时间的选择。因为,除了上面的工具链生态圈,还有书籍和知识传播的生态圈。
标签:面向 时间 正则表达式 有趣 图形界面 list c++ ali 电子邮件
原文地址:http://www.cnblogs.com/welltian/p/8004206.html