参考了许多资料加上个人理解,对十大算法进行如下分类:
?分类算法:C4.5,CART,Adaboost,NaiveBayes,KNN,SVM
?聚类算法:KMeans
?统计学习:EM
?关联分析:Apriori
?链接挖掘:PageRank...
分类:
编程语言 时间:
2014-11-03 11:32:18
阅读次数:
241
输入格式: A 1 B,C,D B 1 C,Dmap: B A 1/3 C A 1/3 D A 1/3 A |B,C,D C B 1/2 D B 1/2 B |C,Dreduce: B (1-0.85)+0....
分类:
其他好文 时间:
2014-10-29 16:14:31
阅读次数:
237
所谓的“百度权重”,指的是爱站、站长工具等网站推出的针对网站关键词排名预计给网站带来流量而划分的评估数据。“百度权重”并不是像谷歌的PageRank那样的对网站的综合评级的算法,而只是针对关键词排名方面给网站带来的欢迎度进行评级,因此非常容易作弊。百度官方就曾经发布过一个公告,告诉大家世界上并没有所...
分类:
其他好文 时间:
2014-10-28 13:28:17
阅读次数:
174
我接触过的大数据有:
1.美国棱镜计划
2.前几天新闻报道的,苹果公司窃取用户隐私
3.百度的用户搜素习惯统计分析
4.淘宝的用户购物习惯分析,智能推荐宝贝
5.浏览器的智能标签页
...
最想了解的大数据架构与算法:
1.著名的Google 网页排名算法:PageRank
2.著名的聚类算法:K-Means
7.CART
3.C4.5
4.k-Mea...
分类:
其他好文 时间:
2014-10-27 11:00:21
阅读次数:
214
1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模...
分类:
编程语言 时间:
2014-10-25 21:16:29
阅读次数:
301
1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模...
分类:
编程语言 时间:
2014-10-23 20:31:41
阅读次数:
235
谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-IDF效果一般,不如TextRank好。TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,让每一个单词给它的邻居(术语称窗口)投赞成票,票的权重取决于自...
分类:
编程语言 时间:
2014-10-14 13:31:48
阅读次数:
189
PageRank算法是Google的核心搜索算法,在所有链接型文档搜索中有极大用处,而且在我们的各种关联系统中都有好的用法,比如专家评分系统,微博搜索/排名,SNS系统等。 PageRank算法的依据或思想: 1,被重要的网页链接的越多(外链) ,此网页就越重要 2,此网页对外的链接越少越重要 这两...
分类:
编程语言 时间:
2014-10-09 18:59:37
阅读次数:
260
1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模...
分类:
其他好文 时间:
2014-10-08 09:49:35
阅读次数:
251
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, N...
分类:
其他好文 时间:
2014-09-27 12:26:29
阅读次数:
205