R中的adabag包均有函数实现bagging和adaboost的分类建模(另外,ipred包中的bagging()函数可以实现bagging回归)。第一题就利用adabag包实现bagging和adaboost建模,并根据预测结果选择最优模型。
a) 为了描述这两种方式,先利用全部数据建立模型:
利用boosting()(原来的adaboost.M1()函数)建立adaboost分...
分类:
其他好文 时间:
2014-12-26 14:42:54
阅读次数:
274
数据源:在以下链接下载酒类化学成分数据,分为红酒,白酒两种数据文件,红酒和白酒在化学成分上有较明显的差异
http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
分析过程:
# 1)先将两组数据混合为一组
# 导入数据源
red
white
# 增加新字段type,1-红酒,2-白酒...
分类:
编程语言 时间:
2014-12-26 14:41:50
阅读次数:
425
一、到底什么是Spark?Spark是一个通用的大数据计算平台,基于“OneStacktorulethemall”的理念成功成为了一体化多元化的大数据处理平台,轻松应对大数据处理中的实时流计算、SQL交互式查询、机器学习和图计算等:Spark源于BDAS:基于该技术堆栈,Spark目前已经成为大数据...
分类:
其他好文 时间:
2014-12-26 14:16:41
阅读次数:
149
斯坦福NG机器学习:K-means笔记 ,无监督学习:经典聚类算法...
分类:
其他好文 时间:
2014-12-25 23:40:41
阅读次数:
203
前言 本文介绍机器学习分类算法中的朴素贝叶斯分类算法并给出伪代码,Python代码实现。词向量 朴素贝叶斯分类算法常常用于文档的分类,而且实践证明效果是挺不错的。 在说明原理之前,先介绍一个叫词向量的概念。 --- 它一般是一个布尔类型的集合,该集合中每个元素都表示其对应的单词是否在文档中出现...
分类:
编程语言 时间:
2014-12-25 23:21:32
阅读次数:
383
链接:http://pan.baidu.com/s/1GWuiM 密码:g2kx先放上代码连接。说下功能:先创建一个 蓝色的 警察局, 然后 创建 红色的 工程建设局。我暂时称 蓝色 红色。 创建后,有一点小bug,我暂时不修了,就是 蓝色的球 会从 警察局 跑到刚刚创建 红色 的地方。只要 拖动 ...
分类:
其他好文 时间:
2014-12-25 17:59:09
阅读次数:
164
引入
一个机器可以根据照片来辨别鲜花的品种吗?在机器学习角度,这其实是一个分类问题,即机器根据不同品种鲜花的数据进行学习,使其可以对未标记的测试图片数据进行分类。
这一小节,我们还是从scikit-learn出发,理解基本的分类原则,多动手实践。
Iris数据集
Iris flower数据集是1936年由Sir Ronald Fisher引入的经典多维数据集,可以作为判别分析(...
分类:
编程语言 时间:
2014-12-25 11:19:34
阅读次数:
402
reference: http://dataunion.org/?p=5044机器学习和深度学习学习资料比较全面的收集了机器学习的介绍文章,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、Deep Learning。《机器学习经典论文/survey合集》 介绍:看题目你已经知道了是什...
分类:
其他好文 时间:
2014-12-25 00:05:56
阅读次数:
375
最近在看机器学习中adaboost(adaptive boostint)算法部分的内容,在csdn上面查找一番发现,好像没有讲的特别的详尽的,当然可能是我人品不佳,所以没有找到,为了防止同样的事情发生在其他人的身上,所以就写了这篇博文,尽量多的解释算法的推演过程更方便的大家去理解这个算法。
介绍adaboost算法之前,首先介绍一下学习算法的强弱,这个是PAC定义的:弱学习算法-...
分类:
编程语言 时间:
2014-12-24 21:38:21
阅读次数:
447
推荐系统植根于不同的研究领域,比如信息检索、信息过滤和文本分类,采用了不同领域的方法,比如机器学习、数据挖掘和基于知识的系统。
《推荐系统》这本书,是一本导读,向读者提供有关这个领域的概述和简介。
在“最新进展”这一部分,介绍了攻击和应对攻击的对策、在线消费决策的理论、新一代互联网技术发展带来的更多可用信息、移动等普适环境的推荐应用等。...
分类:
其他好文 时间:
2014-12-24 16:22:57
阅读次数:
202