Anaconda Distribution是执行Python数据科学和机器学习最简单的方法。 它包括250多种流行的数据科学软件包,以及适用于Windows,Linux和MacOS的 conda 软件包和虚拟环境管理器。 Conda使安装,运行和升级复杂的数据科学和机器学习环境(如Scikit le ...
分类:
其他好文 时间:
2018-10-31 15:46:10
阅读次数:
198
写在前面 GraphLab Create 是一款机器学习的函数库,其中的SFrame也是十分强大的数据管理工具。它允许直接从硬盘中读取数据,免于将数据全部加载到内存中。这就使得对于大数据的处理成为可能.这也是相对于scikit learn的一个最大优点,我们知道,scikit learn是只能读取内 ...
分类:
其他好文 时间:
2018-10-31 15:34:35
阅读次数:
241
Numpy, Scipy, matplotib, pandas, Numpy: numpy是科学计算的基础包之一,其功能包括多维数组,高等数学函数等,以及伪随机数生成器, scikit-learn接受numpy的数组格式数据,所用到的说有的数据都必须转换成Numpy数组, Scipy: scipy是 ...
分类:
其他好文 时间:
2018-10-25 20:15:34
阅读次数:
191
scikit-learn包下有计算TF-IDF的api,其效果也很不错。首先得安装Scikit-clearn Scikit-learn 依赖: Python (>= 2.7 or >= 3.4), NumPy (>= 1.8.2), SciPy (>= 0.13.3). 计算TF-IDF sciki ...
分类:
编程语言 时间:
2018-10-24 17:49:22
阅读次数:
372
【火炉炼AI】机器学习051 视觉词袋模型+极端随机森林建立图像分类器 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 视觉词袋模型(Bag Of Visual Words,BOVW)来源 ...
分类:
其他好文 时间:
2018-10-23 23:10:00
阅读次数:
300
【火炉炼AI】机器学习050 提取图像的Star特征 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 对于图像的特征点,前面我们讨论过边缘检测方法,Harris角点检测算法等,这些检测算法 ...
分类:
其他好文 时间:
2018-10-22 20:33:21
阅读次数:
178
【火炉炼AI】机器学习048 Harris检测图像角点 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 角点检测算法大致有三类:基于灰度图像的角点检测,基于二值图像的角点检测,基于轮廓曲线 ...
分类:
其他好文 时间:
2018-10-22 16:48:40
阅读次数:
179
【火炉炼AI】机器学习046 图像边缘的检测方法 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 图像中各种形状的检测时计算机视觉领域中非常常见的技术之一,特别是图像中直线的检测,圆的检测 ...
分类:
其他好文 时间:
2018-10-22 11:37:16
阅读次数:
137
【火炉炼AI】机器学习045 对股票数据进行隐马尔科夫建模 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 股票数据是非常非常典型的时序数据,数据都是按照日期排列好,而且股价就是我们所能观 ...
分类:
其他好文 时间:
2018-10-19 20:47:41
阅读次数:
136
【火炉炼AI】机器学习042 NLP文本的主题建模 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2, NLTK 3.3) 文本的主题建模时用NLP来识别文本文档中隐藏的某种模式的过程,可以发现 ...
分类:
其他好文 时间:
2018-10-18 16:54:59
阅读次数:
184