原文引自:http://blog.csdn.net/hguisu/article/details/8005192,感谢前面的讨论提到。PageRank忽略了主题相关性,导致结果的相关性和主题性降低,对于不同的用户,甚至有很大的差别。例如,当搜索“苹果”时,一个数码爱好者可能是想要看 iphone 的...
分类:
编程语言 时间:
2014-12-18 18:13:17
阅读次数:
181
上篇我们对时间序列数列有了整体的认识并将时间序列进行了分解,今天和小伙伴们分享常用预测算法中相对最简单的:简单指数平滑法。简单指数平滑适用于可用相加模型描述,并且处于恒定水平和没有季节变动的时间序列地短期预测。
简单指数平滑法提供了一种方法估计当前时间点上的水平。为了更加准确的估计当前时间的水平,我们使用alpha参数来控制平滑,alpha的取值在0-1之间。当alpha越接近0,临近预测的观测...
分类:
编程语言 时间:
2014-12-18 12:00:35
阅读次数:
352
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其...
分类:
编程语言 时间:
2014-12-15 17:02:01
阅读次数:
202
STL源码剖析—算法
在STL中的算法中一些算法是可以根据算法名字来判断算法作用的。所有算法的参数都是迭代器,不过不同的算法调用的迭代器类型也是不同的。多有的STL算法都作用在由迭代器{first,lase)所表示出来的区间上。拷贝(copy)交换(swap)替换(replace)填写(fill)删除(remove)排列组合(permutation)分割(partition)随...
分类:
编程语言 时间:
2014-12-13 19:27:32
阅读次数:
198
一个台阶总共有n 级,如果一次可以跳1 级,也可以跳2 级。
求总共有多少总跳法,并分析算法的时间复杂度。...
分类:
其他好文 时间:
2014-12-08 17:55:14
阅读次数:
128
数据分析算法决策树决策树用于对数据集中的记录进行分类。假设每条记录都含有若干条属性,决策树根据属性进行分类。ID3算法如何决定选取哪条属性来进行划分? 判断条件是根据该属性划分后数据集的信息熵最小(信息熵越小表明数据越整齐),也就是熵差值最大。假设A属性共有n个取值,按照A划分后将获得n个分支,每个...
分类:
编程语言 时间:
2014-12-08 17:10:12
阅读次数:
191
判断哪些对象可回收GC是通过对象是否存活来决定是否进行回收,判断对象是否存活主要有两种算法:引用计数算法、可达性分析算法引用计数算法引用计数的算法原理是给对象添加一个引用计数器,每被引用一次计数器加1,引用失效时减1,当计数器0后表示对象不在被引用,可以被回收了,引用计数法简单高效,但是存在对象之间...
分类:
其他好文 时间:
2014-12-07 21:31:01
阅读次数:
188
上次在使用Lucene建立索引时使用的时自带的StandAnalyzer分词器,而这个分词器在对中文进行分词时只是机械的按字进行划分,因此使用它lucene就不能很好的对中文索引,也就不能实现对中文关键词的检索了,因此其实上次的实践只能对英文进行。
为了解决这个问题,可以使用IKAnalyzer,它是以开源项目Lucene为应用主体的,结合词典分词和文法分析算法的中文分词组件。它支持中英文等分词...
分类:
Web程序 时间:
2014-12-03 19:18:59
阅读次数:
299
1、概述2、对象已死吗?引用计数器 给对象添加一个引用计数器,每当有引用时,计数器加1,引用失效时,计数器减1;任何时刻计数器为0的对象就是不可能再被使用的。 若对象是循环引用,则无法处理。JVM不使用。可达性分析算法 通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜...
分类:
编程语言 时间:
2014-12-03 00:12:31
阅读次数:
181