码迷,mamicode.com
首页 > Web开发 > 详细

大数据支持下的网站内容采集策略

时间:2016-06-13 11:43:47      阅读:195      评论:0      收藏:0      [点我收藏+]

标签:

本文并不讨论纯SEO问题,而是着眼于百度大数据,对采集内容进行筛选,让内容具有先天的优势,自然而然获得排名。

基本原理:

  假设现在有一个页面,内容已确定,百度给它打分是98分(百分制)。

  如果和该页面处于同一细分类别的页面有10万个,该页面大约排在第2000-3000位。

  如果和该页面处于同一细分类别的页面只有100个,该页面大约排在第2-3位。

  所谓“同一细分类别”,即是指搜索某关键词显示出来的结果数,也可以理解为收录量。也就是说,页面质量一定的情况下,关键词收录量越大,竞争越大,排名越靠后,反之亦然。概括起来就是:物以稀为贵

 

  作为任何一个成熟的网站,都应该有自己的关键词库。作为一个主要靠采集发布内容的网站,更应该优先筛选关键词,而不是整站去copy别人的内容。本文所推荐的关键词筛选方案,即是优先收录量少的词。这样的词如何获取?如何知道每一个词的收录量?站长之家词库网,已经给出了答案。从词库网购买所在行业的海量关键词,从中筛选收录量小且指数高的词,再以这些词作为目标去采集内容,将会比较容易获得排名。

大数据支持下的网站内容采集策略

标签:

原文地址:http://www.cnblogs.com/gujing/p/5579899.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!