参考:http://blog.csdn.net/dongtingzhizi/article/details/159627971.简述 在线性回归中,h函数的输出值为连续值,当需要进行归类时,输出的应该是离散值,如何将连续值转换成离散值? 如果分类结果只有两个,用1,0表示。我们希望有:函数1/(1+...
分类:
编程语言 时间:
2014-10-13 19:41:28
阅读次数:
198
1. 例子引入:如上篇的play or not 例子。未知分类的样本:D:, 是 or 否?我们要判断该样本的分类,即比较该样本属于是的概率大还是否的概率大 P(是/否|A=sunny, B=cool, C=high ,D=strong)P(是|A=sunny, B=cool, C=high ,D=...
分类:
编程语言 时间:
2014-10-12 22:01:08
阅读次数:
488
1、k-近邻算法算法原理:存在一个样本数据集(训练样本集),并且我们知道样本集中的每个数据与其所属分类的对应关系。输入未知类别的数据后将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似(最近邻)的k组数据。然后将k组数据中出现次数最多的分类,来作为新数据的分类。算法步...
分类:
其他好文 时间:
2014-10-12 20:39:28
阅读次数:
199
SVM,支持向量机。数据挖掘中的一个经典算法,博主学了挺久,把学到的一些东西跟大家分享一下。
支持向量机(SVM,Support Vector Machine)是在高维特征空间使用线性函数假设空间的学习系统,它由一个来自最优化理论的学习算法训练,该算法实现了一个由统计学习理论到处的学习偏置.此学习策略由Vapnik和他的合作者提出,是一个准则性的
并且强有力的方法.在它提出来的若干年来,在范...
分类:
编程语言 时间:
2014-10-11 19:34:26
阅读次数:
352
例子:分类:play or not ?(是/否) 目的:根据训练样本集S构建出一个决策树,然后未知分类样本通过决策树就得出分类。问题:怎么构建决策树,从哪个节点开始(选择划分属性的问题)方法:ID3(信息增益),C4.5(信息增益率),它们都是用来衡量给定属性区分训练样例的能力。1. 为了理解信息....
分类:
编程语言 时间:
2014-10-11 16:33:06
阅读次数:
256
例子:某人想要由以下1000行训练样本数据构建一个分类器,将数据分成3类(喜欢,一般,不喜欢)。样本数据的特征有主要有3个,A:每年获得的飞行常客里程数B:玩视频游戏所耗时间百分比C:每周消费冰淇淋公升数1. 数据的读取 1 filename='D://machine_learn//Ch02//da...
分类:
编程语言 时间:
2014-10-11 15:32:15
阅读次数:
398
网上介绍K-近邻算法的例子很多,其Python实现版本基本都是来自于机器学习的入门书籍《机器学习实战》,虽然K-近邻算法本身很简单,但很多初学者对其Python版本的源代码理解不够,所以本文将对其源代码进行分析。
什么是K-近邻算法?
简单的说,K-近邻算法采用不同特征值之间的距离方法进行分类。所以它是一个分类算法。
优点:无数据输入假定,对异常值不敏感
缺点:复杂度高
...
分类:
编程语言 时间:
2014-10-10 23:56:14
阅读次数:
326
在 STL 中,算法是一系列的函数模版。STL 提供了大概 70 个算法,由头文件 、、组成。
头文件 是最大的一个,里面常用到的功能有:查找、排序、修改、移除、交换、合并等;
头文件 较小,主要包括数序运算的函数模版;
头文件 中则定义了一些类模版,来声明函数对象;
算法的分类:
算法按其实现的功能可分为 8 类:查找、排序、数值计算、比较、集合、容器管理、统计和对操...
分类:
其他好文 时间:
2014-10-10 02:06:43
阅读次数:
274
这两天学习了一个相对比较简单但是十分实用的分类算法——贝叶斯分类算法,与我做项目使用的svm算法相比确实有很多精妙之处,。好比撒尿牛丸——好吃又好玩,而贝叶斯分类器则是简单又强大。本文结合简单天气预报进行讲解。
贝叶斯定理:
贝叶斯定理是概率论里面一个计算条件概率的法器!为什么是法器,且看后文。先摆出计算公式:
也许乍一看这公式没什么,但是我们先将公式移项得:P(A|B)P(B)=P...
分类:
其他好文 时间:
2014-10-09 16:31:18
阅读次数:
274
转:http://blog.csdn.net/xlm289348/article/details/8876353KNN主要作用为对于未知类型的样本,来判断样本属于哪一类。判断思想是,基于欧几里得定理,判断未知事物的特征和哪一类已知事物的的特征最接近。图片说明:图片说明:简单来说,K-NN可以看成:有...
分类:
其他好文 时间:
2014-09-25 20:42:27
阅读次数:
240