CSDN的博主poson在他的博文《机器学习的最优化问题》中指出“机器学习中的大多数问题可以归结为最优化问题”。我对机器学习的各种方法了解得不够全面,本文试图从凸优化的角度说起,简单介绍其基本理论和在机器学习算法中的应用。 1.动机和目的 人在面临选择的时候重视希望自己能够做出“最好”的选择,如果把...
分类:
其他好文 时间:
2014-08-16 21:03:31
阅读次数:
192
大数据下的游戏营销模式革新邓大付博士腾讯专家工程师Bio:毕业于华中科技大学,现任腾讯IEG运营部数据中心技术副总监,负责腾讯游戏的数据挖掘相关工作,包括有用户画像,推荐系统,基础算法研究等。主要感兴趣的领域包括有分布式计算平台系统架构,机器学习算法等。=======================...
分类:
其他好文 时间:
2014-08-13 00:42:25
阅读次数:
453
从假设函数、损失函数、优化目标和实现的角度总结几个常用的机器学习算法
分类:
其他好文 时间:
2014-08-07 22:55:55
阅读次数:
189
5个提案的14个开题报告,涉及数据可视化实践、社交云电视模型、Spark上流式机器学习算法实现、基于云存储的Linux系统增强服务和网络拓扑距离的高效KNN查询。...
分类:
其他好文 时间:
2014-08-07 18:58:10
阅读次数:
306
在理解了我们需要解决的机器学习问题之后,我们可以思考一下我们需要收集什么数据以及我们可以用什么算法。本文我们会过一遍最流行的机器学习算法,大致了解哪些方法可用,很有帮助。机器学习领域有很多算法,然后每种算法又有很多延伸,所以对于一个特定问题,如何确定一个正确的算法是很困难的。本文中我想给你们两种方法...
分类:
其他好文 时间:
2014-08-07 00:17:17
阅读次数:
255
机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。本文作为学习研究数据系列博文的开篇,列举了4个最流行的机器学习数据集。IrisIris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,花...
分类:
其他好文 时间:
2014-08-07 00:15:56
阅读次数:
242
在机器学习的应用背景是多种多样的,做实际工程必须学会如何根据 具体的问题评估一个学习模型的好坏,如何合理地选择模型、提取特征,如何进行参数调优。这些也是我以前做模式识别时欠缺的环节,所以在遇到识别率很低的情 况时,往往很困惑,不知道该如何改进:到底是应该改进模型改变特征、还是应该增加训练样本数量,到...
分类:
其他好文 时间:
2014-08-03 23:00:26
阅读次数:
287
1.基础概念:
(1) 10折交叉验证:英文名是10-fold cross-validation,用来测试算法的准确性。是常用的测试方法。将数据集分成10份。轮流将其中的9份作为训练数据,1分作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证,在求其平均值,对算法的准确性进行估计。
...
分类:
其他好文 时间:
2014-08-01 13:47:32
阅读次数:
250
二种类别的点在平面上分布,我想找到一条直线,将平面划为两半边,每一边的点类别尽可能的统一,如何找到效果最佳的分界线,这就是最佳拟合问题,也叫作回归问题。 这次,代码很少。logRegres.py #?coding:utf-...
分类:
其他好文 时间:
2014-07-21 10:24:21
阅读次数:
321
学习方式根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法,这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。监督式学习:在监...
分类:
其他好文 时间:
2014-07-21 08:08:39
阅读次数:
327