======================================================================
本系列博客主要参考 Scikit-Learn 官方网站上的每一个算法进行,并进行部分翻译,如有错误,请大家指正
转载请注明出处
===========================================================...
分类:
编程语言 时间:
2016-04-26 02:14:11
阅读次数:
851
1 抽象成数学问题明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分类还是回归或者是聚类的问题,如果都不是的话,如果划归为其中的某类问题。 2 获取数据数据决定了机器学习结 ...
分类:
其他好文 时间:
2016-04-25 22:34:44
阅读次数:
212
作者: peghoty 出处: http://blog.csdn.net/peghoty/article/details/9286905 社区发现(Community Detection)算法用来发现网络中的社区结构,也可以看做是一种聚类算法。 以下是我的一个 PPT 报告,分享给大家。 社区是一个 ...
分类:
编程语言 时间:
2016-04-24 14:07:44
阅读次数:
288
一、从用户的角度考虑 1、搜狗搜索的界面十分简洁方便,没有杂乱的东西,提醒用户搜索的标识十分的醒目,使用户的视觉效果比较舒适。 2、搜狗搜索分析和理解用户可能的查询意图,对不同的搜索结果进行分类,对相同的搜索结果进行聚类,引导用户更快速准确定位自己所关注的内容。包括网页搜索、音乐搜索、图片搜索、新闻 ...
分类:
其他好文 时间:
2016-04-23 21:29:00
阅读次数:
172
聚类和分类判别有什么区别? 聚类应用场景:寻找优质客户 二八定律无处丌在20%的用户提供了银行80%的利润来源20%的用户消费了运营商话费总额的80%公司中20%的员工完成了80%的工作社会中20%的人拥有80%的话语权 聚类应用场景:推荐系统 关键度量指标:距离 距离的定义常用距离(薛毅书P469 ...
分类:
其他好文 时间:
2016-04-23 21:24:33
阅读次数:
252
分类:分类的意义 传统意义下的分类:生物物种预测:天气预报决策:yes or no分类的传统模型分类(判别分析)与聚类有什么差别?有监督学习,无监督学习,半监督学习 常见分类模型与算法 线性判别法距离判别法贝叶斯分类器决策树支持向量机(SVM)神经网络 文本挖掘典型场景 网页自动分类垃圾邮件判断评论 ...
分类:
编程语言 时间:
2016-04-23 18:12:03
阅读次数:
221
主成分分析 Pearson于1901年提出,再由Hotelling(1933)加以发展的一种多变量统计方法通过析取主成分显出最大的个别差异,也用来削减回归分析和聚类分析中变量的数目可以使用样本协方差矩阵或相关系数矩阵作为出发点进行分析成分的保留:Kaiser主张(1960)将特征值小于1的成分放弃, ...
分类:
其他好文 时间:
2016-04-23 18:05:51
阅读次数:
167
介绍
Waffles 英文原意是蜂蜜甜饼,在这里却指代一个非常强大的机器学习的开源工具包。Waffles里包含的算法特别多,涉及机器学习的方方面面,推荐系统位于其中的Waffles_recommend tool,大概只占整个Waffles的1/10的内容,其它还有分类、聚类、采样、降维、数据可视化、音频处理等许许多多工具包,估计能与之媲美的也就数Weka了。...
分类:
其他好文 时间:
2016-04-22 20:19:44
阅读次数:
211
@sprt
写在开头:博主在开始学习机器学习和Python之前从未有过任何编程经验,这个系列写在学习这个领域一个月之后,完全从一个入门级菜鸟的角度记录我的学习历程,代码未经优化,仅供参考。有错误之处欢迎大家指正。...
分类:
编程语言 时间:
2016-04-22 19:45:23
阅读次数:
285
非监督分类的概念: 非监督分类,又称“聚类分析或者点群分析”。在多光谱图像中搜寻、定义其自然相似光谱集群的过程。它不必对图像地物获取先验知识,仅依靠图像上不同地物光谱信息进行特征提取,在统计特征的差别来达到分类的目的,最后对已分出的各个类别的实际属性进行确认。 在ENVI中ISODATA和K-Mea ...
分类:
其他好文 时间:
2016-04-21 01:19:04
阅读次数:
217