码迷,mamicode.com
首页 > 其他好文 > 详细

啥时候懈怠意味着长进停止意味着被淘汰

时间:2016-07-31 15:43:10      阅读:219      评论:0      收藏:0      [点我收藏+]

标签:

前段时间,工作上需要做一个针对视频质量的统计分析系统,各端(PC端、移动端和 WEB端)将视频质量数据放在一个 HTTP 请求中上报到服务器,服务器对数据进行解析、分拣后从不同的维度做实时和离线分析。(ps:这种活儿本该由统计部门去做的,但由于各种原因落在了我头上,具体原因略过不讲……)

KNN的工作原理是:存在一个样本数据集合,也称为训练样本集,而且样本集中每个数据都存在标签,也就是我们知道样本集中每一个数据与所属分类对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。怎样理解这句话呢,现在我们想,假如广场上有很多狗,这些狗都是一条母狗带一群小狗,各个品种的都有。每条狗都都知道自己的母亲是谁。但是有一条狗喝了不下心忘情水,不知道自己妈妈在哪了,如何找他的母亲呢。那我们就把这条狗的特征与那些小狗的特征进行对比。然后取最相似的狗,那么他的母亲就是这只单身狗的母亲~~我们可以想象,一只吉娃娃一定离一直泰迪很远吧。

相当于使用这三个属性,代表一个人。不同的人,三个属性值各不相同。使用向量[feature1, feature2, feature3]来表示一个约会对象。约会的结果,有三种可能:不满意,还可以,很满意。使用class来表示约会结果。这样一来,每条历史约会纪录可以表示为向量[feature1, feature2, feature3, class],其中:

feature1:每天飞行里程数
feature2:每周打游戏所花时间
feature3:每周能吃多少冰激凌
class:约会结果

最近在忙着准备校招的相关复习,所以也整理了一下上学期上课时候的学到的一些知识。刚好发现当时还写了一篇类似于文献综述性质的文章,就在这里贴出来。题材是关于大数据的,也是比较火热的一个话题,虽然现在接触的项目与大数据不太有关联,可能以后也不一定从事这方面的工作吧。

啥时候懈怠意味着长进停止意味着被淘汰

标签:

原文地址:http://www.cnblogs.com/nwydtu/p/5723037.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!