算算时间,从开始到现在,做机器学习算法也将近八个月了。虽然还没有达到融会贯通的地步,但至少在熟悉了算法的流程后,我在算法的选择和创造能力上有了不小的提升。实话说,机器学习很难,非常难,要做到完全了解算法的流程、特点、实现方法,并在正确的数据面前选择正确的方法再进行优化得到最优效果,我觉得没有个八年十...
分类:
其他好文 时间:
2015-07-26 15:32:13
阅读次数:
117
一个Windows操作系统能够使用的pythonIDE
winPython下载地址:WinPython_2.7
传统的F-measure或平衡的F-score (F1 score)是精度和召回的调和平均值:F1=2precision?recallprecision+recallF_1 = 2\dfrac{precision * recall}{precision + recall}1.Cross...
分类:
其他好文 时间:
2015-07-24 22:38:04
阅读次数:
259
参考NB:高效、易实现;性能不一定高LR:对数据的假设少,适应性强,可用于在线学习;要求线性可分决策树:易解释,对数据线性与否无关;易过拟合,不支持在线RF:快速并且可扩展,参数少;可能过拟合SVM:高准确率、可处理非线性可分数据(可处理高维数据);内存消耗大,难于解释,运行和调参麻烦
分类:
编程语言 时间:
2015-07-24 20:21:23
阅读次数:
136
本文主要参考了OpenCV的官方文档
http://docs.opencv.org/modules/ml/doc/boosting.html
boosting算法是一个监督式机器学习算法,它解决的是一个二元分类问题。本文包括对算法思想的理解,不包含算法的数学推导。
目标检测就是用这个分类算法,把只含有目标的图片作为一类,不含有目标的作为另一类,然后训练分类器,进行检测的时候,输入...
分类:
编程语言 时间:
2015-07-24 10:46:24
阅读次数:
173
声明:本篇博文根据http://www.ctocio.com/hotnews/15919.html整理,原作者张萌,尊重原创。 机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考。 机...
分类:
编程语言 时间:
2015-07-22 08:05:16
阅读次数:
157
转自csdn,加上一些自己的理解。基于特征化工程进行用户特征化,结合相关的机器学习算法对业务进行挖掘建模,在广告的精准投放、预测、风控等领域中应用的非常广泛。无论是有监督的学习分类算法,还是无监督的聚类也罢,都需要建立特征向量,对特征进行预处理;其中对于有监督的训练时,还需要进行样本的筛选。本章节讲...
分类:
其他好文 时间:
2015-07-17 20:42:49
阅读次数:
1713
Apache Hadoop和Apache Spark 接下来谈多核机器、 PB级数据和任务,这跟所有从twitter提到的Java或重载机器学习算法类似。谈到Hadoop,不得不说这个应用广泛的框架及它的组 件:Hadoop分布式文件系统(HDFS)、资源管...
分类:
其他好文 时间:
2015-07-13 12:29:55
阅读次数:
141
机器学习入门资源--汇总基本概念机器学习机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习...
分类:
其他好文 时间:
2015-07-06 23:19:23
阅读次数:
189
http://blog.csdn.net/pipisorry/article/details/41957763文本特征提取词袋(Bag of Words)表征文本分析是机器学习算法的主要应用领域。可是,文本分析的原始数据无法直接丢给算法。这些原始数据是一组符号,由于大多数算法期望的输入是固定长度的数...
分类:
其他好文 时间:
2015-07-01 13:39:28
阅读次数:
3843
因为工作需要,开始了python的学习之旅。学习的主要内容包括python基础知识、python数据分析基础知识、numpy专题学习、基于python的机器学习算法实现。下面是系列笔记的一个大纲,希望朋友们多提意见和建议。【一】python基础知识python基础教程学习笔记---(1)基础语法py...
分类:
编程语言 时间:
2015-07-01 00:56:43
阅读次数:
210