机器学习的入门书籍《机器学习实战》使用的语言是python。下面介绍利用Python开始“机器学习”的准备工作。(环境:CentOS 7)
1, 两个重要的包
NumPy 和 SciPy。(http://scipy.org/scipylib/download.html )主要是处理数值运算,矩阵操作等。
注:Sci是Science的缩写。
官网介绍了安装方法,可以手动安装,也可以使...
分类:
编程语言 时间:
2014-10-10 18:20:44
阅读次数:
232
乔丹教授(Michael I. Jordan)教授是机器学习领域神经网络的大牛,他对深度学习、神经网络有着很浓厚的兴趣。因此,很多提问的问题中包含了机器学习领域的各类模型,乔丹教授对此一一做了解释和展望。首先被提到的就是经典的贝叶斯非参数模型。今年暑假,乔丹教授在Como开设了贝叶斯非参数模型的课程...
分类:
其他好文 时间:
2014-10-10 13:52:04
阅读次数:
169
贝叶斯公式描述的是一组条件概率之间相互转化的关系。
在机器学习中,贝叶斯公式可以应用在分类问题上。这篇文章是基于自己的学习所整理,并利用一个垃圾邮件分类的例子来加深对于理论的理解。
这里我们来解释一下朴素这个词的含义:
1)各个特征是相互独立的,各个特征出现与其出现的顺序无关;
2)各个特征地位同等重要;
以上都是比较强的假设
下面是朴素贝叶斯分类的流程:...
分类:
其他好文 时间:
2014-10-09 21:39:17
阅读次数:
205
本节课主要介绍人工神经网络.通过介绍评定模型,随机梯度下降法,生物启发和感知器系统,讲师用视图和数学解析式详细地讲解了神经网络的运行过程以及原理....
分类:
其他好文 时间:
2014-10-09 19:39:57
阅读次数:
256
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼....
分类:
其他好文 时间:
2014-10-09 15:04:14
阅读次数:
191
设(x1, y1), (x2,y2), ...(xk,yk)为输入样本,注意这里的xi本身是一个向量。
假设拟合多项式为:
则通过使用下面的最小平方差拟合方法:
可得:
拟合过程变成求上式的最小值,相信学过高数的童鞋应该都知道怎么求,对的以此对系数a0,a1....求偏导数,使其为零,最后可得K+1组方程:
.......................
...
分类:
其他好文 时间:
2014-10-08 18:22:55
阅读次数:
180
考虑用机器学习建立一个邮件过滤系统,来将邮件分成垃圾邮件和非垃圾邮件。首先我们建立一个词典,里面包含了邮件中所有的不重复单词。我们用长度为词典中单词数目的特征向量来表示一封邮件。如下所示:表示一封邮件,如果该邮件包含有词典中的第i个单词,那么,否则.为了建模,作一个很强的假设,假设词典中的每个单词是...
分类:
其他好文 时间:
2014-10-08 01:25:54
阅读次数:
385
课程简介:
主要内容包括对线性分类及线性回归分析的简单回顾,以及对逻辑回归分析,误差测定与算法三方面的详细讲解,同时对非线性变换的泛化方法进行了剖析....
分类:
其他好文 时间:
2014-10-08 00:16:14
阅读次数:
365
本文转自:http://www.52nlp.cn/python-%E7%BD%91%E9%A1%B5%E7%88%AC%E8%99%AB-%E6%96%87%E6%9C%AC%E5%A4%84%E7%90%86-%E7%A7%91%E5%AD%A6%E8%AE%A1%E7%AE%97-%E6%9C%...
分类:
编程语言 时间:
2014-10-07 19:07:03
阅读次数:
331
(一)SVM的背景简单介绍支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出很多特有的优势,并可以推广应用到函数拟合等其它机器学习问题中[10]。支持向量机方法是建立在统计学习理论的VC 维理论和...
分类:
其他好文 时间:
2014-10-07 15:20:53
阅读次数:
367