码迷,mamicode.com
首页 >  
搜索关键字:机器学习算法    ( 1077个结果
机器学习基础
自己总结的机器学习基础算法,和相应的python代码实现,直接上传word和python代码 机器学习算法基础及Python实现 目录 一 机器学习概述... 4 1.1 统计学习... 4 1.2 监督学习... 4 1.3 模型评估与选择... 4 1.4 模型的泛化能力... 5 二 预测算法... 5 1 一元线性回归... 5 1.1 为什么...
分类:其他好文   时间:2015-04-25 22:47:56    阅读次数:187
迁移学习(Transfer Learning)(转载)
原文地址:http://blog.csdn.net/miscclp/article/details/6339456在传统的机器学习的框架下,学习的任务就是在给定充分训练数据的基础上来学习一个分类模型;然后利用这个学习到的模型来对测试文档进行分类与预测。然而,我 们看到机器学习算法在当前的Web挖掘研...
分类:其他好文   时间:2015-04-25 19:45:44    阅读次数:244
十大数据挖掘算法
1. C4.5C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;2)在树构造过程中进行剪枝;3)能够完成对连续属性的离...
分类:编程语言   时间:2015-04-23 12:30:07    阅读次数:203
【软件分析与挖掘】A Comparative Study of Supervised Learning Algorithms for Re-opened Bug Prediction
摘要: 本文主要是评估多种监督机器学习算法的有效性,这些算法用于判断一个错误报告是否是reopened的,算法如下: 7种监督学习算法:kNN,SVM, SimpleLogistic,Bayesian Network, Decision Table, CARTand LWL; 3种集成学习算法: A...
分类:其他好文   时间:2015-04-20 10:58:45    阅读次数:160
【机器学习实验】scikit-learn的主要模块和基本使用
引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。 在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们假设输入时一个特征矩阵或者csv文件。 首先,数据应该被载入内存中。 scikit-learn的...
分类:其他好文   时间:2015-04-19 11:37:16    阅读次数:241
麻省理工的 Picture 语言:代码瘦身的秘诀
直击现场如今,机器学习算法已经进入了主流的计算机,而麻省理工学院正在研究一款让每日的编程变得更加简单的技术。MIT 研究者将在六月发布一款新的叫做 Picture 的编程语言,当计算机在视频或者图像上识别目标时,它能从根本上降低代码量。这是一个相对较新的编程原型,叫概率编程,它能减少复杂任务所需的代...
分类:编程语言   时间:2015-04-17 19:46:11    阅读次数:132
【找工作】我把经验留下来——海外找工作篇
Wang Meng (Facebook offer)一、刷题1线段是否有重合2递归式(求树的高度,列式子再写代码) 循环不变量(在循环前,中,后都为真) !!位运算求均值二、简历实习牛项目,实验室牛项目 > 实习水项目 > 实验室水项目项目的介绍:项目是什么,你的工作,结果算法类(一些机器学习算法)...
分类:其他好文   时间:2015-04-16 23:36:02    阅读次数:138
机器学习算法优缺点及其应用领域
原文:http://blog.csdn.net/mach_learn/article/details/39501849决策树一、 决策树优点1、决策树易于理解和解释,可以可视化分析,容易提取出规则。2、可以同时处理标称型和数值型数据。3、测试数据集时,运行速度比较快。4、决策树可以很好的扩展到大型数...
分类:编程语言   时间:2015-04-16 19:44:54    阅读次数:139
mllib之随机森林与梯度提升树
随机森林和GBTs都是集成学习算法,它们通过集成多棵决策树来实现强分类器。 集成学习方法就是基于其他的机器学习算法,并把它们有效的组合起来的一种机器学习算法。组合产生的算法相比其中任何一种算法模型更强大、准确。 随机森林和梯度提升树(GBTs)。两者之间主要差别在于每棵树训练的顺序。 随机森林通过对数据随机采样来单独训练每一棵树。这种随机性也使得模型相对于单决策树更健壮,...
分类:其他好文   时间:2015-04-13 22:59:00    阅读次数:892
Spark与Hadoop的区别
【适用场景不同】 Hadoop:分布式批处理计算,强调批处理,常用于数据挖掘、分析 Spark:是一个基于内存计算的开源的集群计算系统,那些在并行操作之间重用工作数据集(比如机器学习算法)的工作负载。为了优化这些类型的工作负载,Spark 引进了内存集群计算的概念,可在内存集群计算中将数据集缓存在内...
分类:其他好文   时间:2015-04-12 22:21:15    阅读次数:541
1077条   上一页 1 ... 89 90 91 92 93 ... 108 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!