标签:topic 方法 log and 规范 auth 应用 ges 计算机
HITS
1 概述
HITS(hypertext induced topic search)超链接归纳主题搜索是由kleinbers在90年代提出的基于链接分析的网页排名算法。Hits算法是利用HubAuthority的搜索方法,即中心权威的思想。
Hits算法的基本思想:
即:一个优秀的中心页必然会指向很多优秀的权威页,一个优秀的权威页必然会被很多优秀的中心页指向。
2 网页收集
在算法描述前,先描述HITS算法是如何收集待评级的网页的。HITS将根据如下描述来搜索页面集合:
接着HITS对S集内部的每张网页进行处理,对每张S集内部的网页指定一个权威分值和中心分值。
3 HITS算法
HITS算法的求解过程如下:
具体操作:
????假设待考察的网页数目为n。我们用G=(V,E)来表示S的有向链接图。V是网页集,E是有向边集。我们用L来表示图的邻接矩阵。
每张网页i的权威分值被表示为a(i),中心分值被表示为h(i)。两种分值的相互增益关系为:
将它们写成矩阵形式,用a表示所有权威分值的列向量,,
用h表示所有中心分值的列向量,,
计算权威分值和中心分值采用幂迭代方法。迭代公式如下:
初始情况如下:
在每次迭代后,数据要进行归一化处理。满足:
当时,停止迭代。
4 HITS算法和PageRank算法比较
????相同:
两种算法那都利用了特征向量作为理论基础和收敛基础。这也是超链接环境下此类算法的共同特征。
????不同:
参考文献:
?
[1] [1]常庆,周明全,耿国华. 基于PageRank和HITS的Web搜索[J]. 计算机技术与发展,2008,(07):77-79.
[2] http://blog.csdn.net/androidlushangderen/article/details/43311943
?
?
标签:topic 方法 log and 规范 auth 应用 ges 计算机
原文地址:http://www.cnblogs.com/smuxiaolei/p/7614289.html