码迷,mamicode.com
首页 > Web开发 > 详细

新站帮助 Google 查找、抓取网站和创建索引的最佳做法

时间:2014-06-10 20:40:45      阅读:315      评论:0      收藏:0      [点我收藏+]

标签:code   java   http   get   com   strong   

遵循这些指南有助于 Google 查找您的网站、将其编入索引和进行排名。即使您选择不采纳这些建议,我们也强烈建议您对“质量指南”多加留意,其中简要说明了可能导致网站从 Google 索引中被彻底删除或者被系统或手动标识为垃圾网站的一些违规行为。如果一个网站被标识为垃圾网站,那么它可能不会再出现在 Google.com 或任何 Google 合作伙伴网站的搜索结果中。

  • 设计和内容指南
  • 技术指南
  • 质量指南

在您的网站创建完成后

 

 

    • 对于应知道您网页情况的所有网站,请务必通知它们您的网站已处于在线状态。

 

设计和内容指南

    • 网站应具有清晰的层次结构和明确的文本链接。每个网页应至少可以通过一个静态文本链接打开。

 

    • 为用户提供站点地图,地图中应包含有指向网站重要部分的链接。如果站点地图中包含的链接数量过多,您应将该站点地图分成多个网页。

 

    • 将特定网页上的链接限制在合理的数量内。

 

    • 网站应实用且信息丰富,网页文字应清晰、准确地表述要传达的内容。

 

    • 要考虑到用户会使用哪些字词来查找您的网页,确保网站上确实包含了这些文字。

 

    • 尽量使用文字而不是图片来显示重要的名称、内容或链接。Google 抓取工具无法识别图片中所含的文字。如果您必须使用图片代替文字性内容,请考虑使用“ALT”属性添加一些描述性文字。

 

    • 确保 <title> 元素和 ALT 属性具有描述性且准确无误。

 

    • 检查链接是否损坏,以及 HTML 格式是否正确。

 

    • 如果要使用动态网页(即网址中包含“?”字符),请注意并非每一个搜索引擎信息采集软件都能抓取动态和静态网页。这有助于缩短参数的长度并减少参数的数量。

 

 

技术指南

    • 使用诸如 Lynx 的文本浏览器来检查您的网站,因为大多数搜索引擎“蜘蛛”程序查看您网站的方式与 Lynx 几乎一样。如果诸如 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂功能造成您无法在文本浏览器中看到整个网站,则搜索引擎信息采集软件在抓取您的网站时可能会遇到问题。

 

    • 允许搜索漫游器在不使用可跟踪其网站访问路径的会话 ID 或参数的情况下抓取您的网站。这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。如果采用这些技术,可能会导致对网站的索引编制不完整,因为漫游器可能无法排除那些看上去不同、但实际却指向同一个网页的网址。

 

    • 确保您的网络服务器支持 If-Modified-Since HTTP 标头。通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。支持该功能可以节省您的带宽和开销。

 

    • 利用网络服务器上的 robots.txt 文件。该文件会告诉抓取工具哪些目录可以抓取,哪些目录不可抓取。确保该文件是适合您网站的最新版本,以免意外阻止 Googlebot 抓取工具。访问http://code.google.com/web/controlcrawlindex/docs/faq.html,了解如何在漫游器访问您的网站时对其提供指示。您可以利用 Google 网站站长工具中提供的 robots.txt 分析工具对 robots.txt 文件进行测试,确保正确使用该文件。

 

    • 尽可能确保广告不会影响搜索引擎排名。例如,robots.txt 文件会阻止抓取 Google AdSense 广告和 DoubleClick 链接。

 

    • 如果您的公司购买了内容管理系统,请确保搜索引擎可以抓取该系统创建的网页和链接。

 

    • 使用 robots.txt 可避免抓取搜索结果页或其他自动生成的网页,这些网页不会为搜索引擎用户带来太多额外价值。

 

 

  • 监控网站的性能并优化加载时间。Google 的目标是为用户提供相关度最高的搜索结果以及最佳用户体验。飞快的网站速度可以提高用户满意度,还可改善网页的整体质量(尤其对于互联网连接速度慢的用户),我们也希望网页的总体速度会随着网站站长对各自网站的改善而提高。

    Google 强烈建议所有网站站长定期使用 Page SpeedYSlowWebPagetest 或其他工具来监控网站性能。如需更多信息、工具和资源,请参见让网络变得更快。此外,网站站长工具中的网站性能工具会向您显示全球用户浏览您网站时所体验到的速度。

质量指南

这些质量指南涵盖了最常见的作弊形式或操纵行为,对于此处未列出的其他误导行为,Google 也会进行查处。切勿抱有侥幸心理,认为某种欺骗手段未在本页中列出,Google 就会认可该手段。作为网站站长,与其花费大量时间寻找可以钻的漏洞,不如尽其所能维护基本原则,以便为用户带来更好的体验,从而提高的排名。

如果您认为有其他网站正在滥用 Google 的质量指南,请提交垃圾内容报告告知我们。Google 希望能开发出灵活的自动解决方案来解决上述问题,因而尝试尽量避免手动处理违规行为。我们可能不会针对所有举报都一一做出手动操作回应,而且垃圾信息举报会根据对用户的影响排定优先顺序,有时,这可能会导致从 Google 的搜索结果中完全删除含有垃圾内容的网站。然而,并不是所有手动操作都会执行删除操作。即使我们对被举报的网站采取了相应措施,这些操作的影响也可能不会很明显。

质量指南 - 基本原则

    • 您在设计网页时主要考虑的应该是用户,而不是搜索引擎。

 

    • 请不要欺骗用户。

 

    • 请不要为了提高搜索引擎排名而弄虚作假。一条很好的经验法则是,您在向竞争对手网站或 Google 员工解释自己的作为时是否感到坦然。另一个有用的测试手段是扪心自问:“这能否给我的用户带来帮助?如果没有搜索引擎,我会这样做吗?”

 

    • 考虑什么可让您的网站独一无二、有价值或吸引浏览者。让您的网站在相应领域中出类拔萃。

 

质量指南 - 具体指南

避免使用以下方法:

 

 

 

 

 

 

 

 

 

    • 创建带有恶意行为(如网上诱骗、安装病毒、木马或其他有害软件)的网页

 

 

 

建议养成以下良好习惯:

    • 监控网站是否受到黑客攻击,一旦出现被黑内容立即将其删除

 

 

如果您的网站违反以上一条或多条指南的要求,则 Google 可能会通过对该网站执行手动操作来加以防范。当您解决相关问题后,便可以提交网站的重新审核请求

新站帮助 Google 查找、抓取网站和创建索引的最佳做法,布布扣,bubuko.com

新站帮助 Google 查找、抓取网站和创建索引的最佳做法

标签:code   java   http   get   com   strong   

原文地址:http://www.cnblogs.com/good7758/p/3779466.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!