码迷,mamicode.com
首页 >  
搜索关键字:《机器学习实战》 logistic回归    ( 726个结果
机器学习实战笔记9(Apriori算法)
Apriori算法也属于无监督学习,它强调的是“从数据X中能够发现什么”。从大规模的数据集中寻找物品之间隐含关系被称为关联分析或者称为关联规则学习。这里的主要问题在于,寻找物品的不同组合是一项十分耗时的任务,所需的计算代价很高,蛮力搜索并不能解决这个问题。因此此处介绍使用Apriorio算法来解决上述问题。 1:简单概念描述 (1)              频繁项集:指经常出现在一块的物品的...
分类:其他好文   时间:2014-09-09 20:11:19    阅读次数:313
机器学习实战笔记8(kmeans)
前面的7次笔记介绍的都是分类问题,本次开始介绍聚类问题。分类和聚类的区别在于前者属于监督学习算法,已知样本的标签;后者属于无监督的学习,不知道样本的标签。下面我们来讲解最常用的kmeans算法。 1:kmeans算法        Kmeans中文称为k-均值,步骤为:(1)它事先选定k个聚类中心,(2)然后看每个样本点距离那个聚类中心最近,则该样本就属于该聚类中心。(3)求每个聚类中心的样本...
分类:其他好文   时间:2014-09-09 16:17:19    阅读次数:234
【机器学习实战】回归常用技巧之虚拟变量
虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。...
分类:其他好文   时间:2014-09-04 01:43:57    阅读次数:547
最详细的基于R语言的Logistic Regression(Logistic回归)源码,包括拟合优度,Recall,Precision的计算
这篇日志也确实是有感而发,我对R不熟悉,但实验需要,所以简单学了一下。发现无论是网上无数的教程,还是书本上的示例,在讲Logistic Regression的时候就是给一个简单的函数及输出结果说明。从来都没有讲清楚几件事情: 1. 怎样用训练数据训练模型,然后在测试数据上进行验证(测试数据和训练数据可能有重合)? 2. 怎样计算预测的效果,也就是计算Recall,Precision,F...
分类:其他好文   时间:2014-09-03 22:46:07    阅读次数:939
【机器学习实战】多元线性回归模型
当影响Y值的因素不唯一时,我们可以使用多元线性回归模型:...
分类:其他好文   时间:2014-09-02 01:35:34    阅读次数:189
机器学习实战
简述机器学习...
分类:其他好文   时间:2014-09-01 12:37:53    阅读次数:190
python抓取百度彩票的双色球数据
最近在学习《机器学习实战》这本书,在学习的过程中不免要自己去实践,写些练习。这写练习的第一步就需要收集数据,所以为了写好自己的练习程序,我得先学会收集一些网络数据。了解到用python抓取网页数据的一些方法后,我就根据别人的demo,自己实践了一下,学着从百度彩票网站上抓取双色球的历史数据。以下.....
分类:编程语言   时间:2014-08-31 17:04:01    阅读次数:664
logistic回归
一、逻辑回归(LogisticRegression) Logistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。之前在经典之作《数学之美》中也看到了它用于广告预测,也就是根据某广告被用户点击的可能性,把最可能被用户点击的广告摆在用户能看到的地.....
分类:其他好文   时间:2014-08-18 23:28:23    阅读次数:378
机器学习实战笔记7(Adaboost)
1:简单概念描述        Adaboost是一种弱学习算法到强学习算法,这里的弱和强学习算法,指的当然都是分类器,首先我们需要简单介绍几个概念。 1:弱学习器:在二分情况下弱分类器的错误率会高于50%。其实任意的分类器都可以做为弱分类器,比如之前介绍的KNN、决策树、Naïve Bayes、logiostic回归和SVM都可以。这里我们采用的弱分类器是单层决策树,它是一个单节点的决策树。...
分类:其他好文   时间:2014-08-18 22:07:03    阅读次数:334
机器学习实战笔记之非均衡分类问题
通常情况下,我们直接使用分类结果的错误率就可以做为该分类器的评判标准了,但是当在分类器训练时正例数目和反例数目不相等时,这种评价标准就会出现问题。这种现象也称为非均衡分类问题。此时有以下几个衡量标准。 (1)   正确率和召回率               如下图所示:其中准确率指预测的真实正例占所有真实正例的比例,等于TP/(TP+FP),而召回率指预测的真实正例占所有真实正例的比例,等于T...
分类:其他好文   时间:2014-08-18 22:04:13    阅读次数:392
726条   上一页 1 ... 67 68 69 70 71 ... 73 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!