k-邻近算法概述k-邻近算法采用测量不同特征值之间的距离方法进行分类优点:精度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高使用数据范围:数值型和标称型工作原理:存在一个样本数据集合(也称作训练样本集),并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属的对应关系。...
分类:
编程语言 时间:
2015-03-16 16:11:37
阅读次数:
166
题目:http://www.lydsy.com/JudgeOnline/problem.php?id=2653题解:不愧是CLJ的题。Orz 有关中位数的题一般可以二分,大于的标记为1,小于的标记为-1。这样本题单词询问只要求最大子序列连续和即可,线段树搞定。但多次询问。 当二分的值只有...
分类:
其他好文 时间:
2015-03-15 19:43:47
阅读次数:
162
就在前不久,微信朋友圈、微博上到处都在问,这条裙子到底是蓝黑还是白金颜色的?盆盆对这个问题本身并不感兴趣,但是却很想了解一下这个话题是怎么炒作起来的。这也是IT人员的兴趣所在,要用demo实例的方式,找到现象背后的原理!以下就以新浪微博作为样本进行分析。首先打开..
分类:
其他好文 时间:
2015-03-15 11:03:29
阅读次数:
271
1.题目描述:点击打开链接
2.解题思路:本题要求放置尽可能少的服务器,使得所有的客户端到最近的服务器的距离都不超过k。由于已经放置了一个服务器,不妨把它当做根结点,先把无根树转化为有根树,然后我们考虑最深的叶子,那么不难证明,该叶子结点的最优服务器的放置位置是它的k级祖先。这样本题的算法便不难想出:从最深的叶子开始枚举,并在它的k级祖先处放置一个服务器,同时标记该服务器能覆盖到的所有结点,这样...
分类:
其他好文 时间:
2015-03-14 09:40:44
阅读次数:
122
k-邻近算法概述k-邻近算法采用测量不同特征值之间的距离方法进行分类优点:精度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高使用数据范围:数值型和标称型工作原理:存在一个样本数据集合(也称作训练样本集),并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属的对应关系。...
分类:
编程语言 时间:
2015-03-12 23:50:07
阅读次数:
269
一、引言之前提到的k-近邻算法是分类数据最简单最有效的算法。k-近邻算法是基于实例的学习,使用算法时我们必须有接近实际数据的训练样本数据。而且,k-近邻数据必须保全全部数据集,如果训练数据集的很大,必须使用大量的存储空间,此外k-近邻算法必须对数据集中的每个数据计算距离,这是非常耗时的。另外,对于数...
分类:
其他好文 时间:
2015-03-12 22:13:24
阅读次数:
174
Hibernate 是一个优秀的ORM框架体现在:1. 面向对象设计的软件内部运行过程可以理解成就是在不断创建各种新对象、建立对象之间的关系,调用对象的方法来改变各个对象的状态和对象消亡的过程,不管程序运行的过程和操作怎么样,本质上都是要得到一个结果,程序上一个时刻和下一个时刻的运行结果的差异就表现...
分类:
Web程序 时间:
2015-03-12 06:19:57
阅读次数:
203
需求:由于队列中feedback队列积压过多,查找到总线日志process_feedbacks_1.log有time out的下载错误,并且大量的衍生样本下载时间过长 目前需求:计算process_feedbacks_1.log日志中的每个衍生样本的下载时间例如:2014-12-22 10:29:5...
分类:
其他好文 时间:
2015-03-11 23:21:34
阅读次数:
155
SVM能实现功能即在给出的正负样本中找到一条分割线(面),将正负样本分割出来。而这条分割线(面)即我们所说的分类器,其记录的正样本的特征,以及和负样本的区别。当有新的样本过来时,则通过和分类器比较即可分辨出新的样本是否属于正样本行列。
以车辆识别为例,SVM的一般使用步骤如下:
1、获取正负样本。
前面说了SVM能够找到一条存在与正负样本之间的分割线(面),那么何为正负样本呢?
所谓...
分类:
其他好文 时间:
2015-03-11 17:25:59
阅读次数:
183
PCA(Principal component analysis)是一种多元统计方法。最近在研究PCA在故障检测上的运用。在这里说说我对PCA的认识。 首先,我们需要有一组数据X,X是n行m列的数据,为了方便,我们认为数据是均值为0,方差为1的数据。其中n为样本数,m为变量。我们可以找到一个线...
分类:
其他好文 时间:
2015-03-09 20:39:57
阅读次数:
166