随机森林模型是一种数据挖掘模型,常用于进行分类预测。随机森林模型包含多个树形分类器,预测结果由多个分类器投票得出。 决策树相当于一个大师,通过自己在数据集中学到的知识对于新的数据进行分类。俗话说得好,一个诸葛亮,玩不过三个臭皮匠。随机森林就是希望构建多个臭皮匠,希望最终的分类效果能够超过单个大师的一 ...
分类:
其他好文 时间:
2017-04-17 10:01:24
阅读次数:
637
一、关于spark ml pipeline与机器学习 一个典型的机器学习构建包含若干个过程 1、源数据ETL 2、数据预处理 3、特征选取 4、模型训练与验证 以上四个步骤可以抽象为一个包括多个步骤的流水线式工作,从数据收集开始至输出我们需要的最终结果。因此,对以上多个步骤、进行抽象建模,简化为流水 ...
分类:
其他好文 时间:
2017-04-17 09:34:50
阅读次数:
321
基于协同过滤的推荐引擎(理论部分)时隔十日,终于决心把它写出来。大多数实验都是3.29日做的,结合3.29日写的日记完成了这篇实战。数据集准备数据集使用上篇提到的Movielens电影评分数据里的ml...
分类:
其他好文 时间:
2017-04-16 11:29:00
阅读次数:
238
java-ml是基于java的一个机器学习jar,下载地址:http://java-ml.sourceforge.net/ 导入jar包后就可以开始code了,Eclipse引入外部包的教程:http://jingyan.baidu.com/article/ca41422fc76c4a1eae99e ...
分类:
编程语言 时间:
2017-04-14 22:05:13
阅读次数:
467
朴素贝叶斯方法是一种使用先验概率去计算后验概率的方法, 具体见上一节。 算法包:e1071 函数:navieBayes(formule,data,laplace=0,...,subset,na.action=na.pass) Formule: 公式的形式:class~x1 + x2 + ..... ...
分类:
其他好文 时间:
2017-04-10 23:38:50
阅读次数:
573
人工智能 人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。 人工智能的定义可 ...
分类:
其他好文 时间:
2017-04-10 14:43:59
阅读次数:
168
归纳总结机器学习相关的基本术语,以一批西瓜的数据为例,例如:(色泽=青绿;根蒂=蜷缩;敲声=浊响),(色泽=乌黑;根蒂=稍蜷;敲声=沉闷),(色泽=浅白;根蒂=硬挺;敲声=清脆)。。。 示例(instance)/样本(sample):对于某个事件或对象的描述(上例中的一个西瓜) 数据集(data s ...
分类:
其他好文 时间:
2017-04-08 23:51:08
阅读次数:
305
OpenCv的结构和内容 OpenCv源码组成结构其中包括cv, cvauex, cxcore, highgui, ml这5个模块 CV:图像处理和视觉算法 MLL:统计分类器 HighGui:GUI,图像和视频输入输出 CVCORE:包含Opencv的一些基本结构和相关函数 CVAUEX:该模块一 ...
分类:
其他好文 时间:
2017-04-06 15:45:52
阅读次数:
196
收集数据数据来源:http://archive.ics.uci.edu/ml/datasets/Haberman%27s+Survival
文本数据如下图所示:31,65,4,1
33,58,10,...
分类:
编程语言 时间:
2017-04-05 11:02:08
阅读次数:
424
1.下载软件mash32 http://www.masm32.com/download/masm32v11r.zip 此软件包含对汇编文件的编译和运行,下载后直接运行并解压即可 2.配置环境变量 在系统环境中添加如下路径:E:\masm32\bin 查看是否配置成功,可以查看ml和link命令是否O ...
分类:
编程语言 时间:
2017-04-04 18:41:55
阅读次数:
515