码迷,mamicode.com
首页 >  
搜索关键字:索引    ( 32349个结果
百度的搜索引擎相关技术的分析
1、 爬虫(Spider)——数据来源 作为搜索引擎海量数据的来源,爬虫是搜索引擎技术的重要一环,闻道软件工作室有自己开发的爬虫,所以对此技术很熟悉。 爬虫的英文是Spider,其实翻译成蜘蛛更容易理解,无数网站的链接构成了一张巨大的网,搜索引擎的内容采集程序就像一只只勤劳的蜘蛛在这张网上爬...
分类:其他好文   时间:2014-09-22 02:11:11    阅读次数:308
树的高度
题目: 有一颗树,不一定是二叉树,有n个节点,编号为0到n-1。有一个数组A,数组的索引为0到n-1,数组的值A[i]表示节点i的父节点的id,根节点的父节点id为-1。给定数组A,求得树的高度。 分析: 这个题目我们把数组写出来,然后分析,就很明了了。如下例子: 值 3 3 3 ...
分类:其他好文   时间:2014-09-22 00:32:01    阅读次数:257
网络爬虫基本原理(二)
四、更新策略 互联网是实时变化的,具有很强的动态性。网页更新策略主要是决定何时更新之前已经下载过的页面。常见的更新策略又以下三种: 1.历史参考策略 顾名思义,根据页面以往的历史更新数据,预测该页面未来何时会发生变化。一般来说,是通过泊松过程进行建模进行预测。 2.用户体验策略 尽管搜索引擎针对于....
分类:其他好文   时间:2014-09-22 00:31:21    阅读次数:219
基于搜索引擎优化Internet的策略研究
随着Internet技术的迅速发展,使得用户要想在信息海洋里查找目标信息,就如大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是人们获取网络资源的主要工具,然而搜索引擎在给网络用户带来巨大便捷的同时, 由于其信息检索技术智能水平的限制以及对自然语言理解的制约,在网络信息的检索中存在许多不足。因此,搜索引擎优化(Search Engine Optimization,SEO)技术应运而生。  ...
分类:Web程序   时间:2014-09-21 21:56:01    阅读次数:301
GitHub具体教程
GitHub具体教程Table of Contents1 Git具体教程1.1 Git简单介绍1.1.1 Git是何方神圣?1.1.2 重要的术语1.1.3 索引1.2 Git安装1.3 Git配置1.3.1 用户信息1.3.2 高亮显示1.3.3 忽略特定的文件1.3.4 使用.gitkeep来追...
分类:其他好文   时间:2014-09-21 21:23:41    阅读次数:552
《Algorithm Part I:Union-Find》
1.动态联通性问题描述:        有N个元素,开始时我们让每一个元素肚子构成一个集合。然后按一定的顺序将属于同一组中的元素合并,构成新的集合。其间要反复查询某个元素在哪个集合中。如下所示: 解决办法: (1)Quick-Find 声明一个长度为N的数组id,数组中元素的值代表它所属组的编号。将数组中的元素初始化为每个元素的索引值,这样就表示开始时每个元素各自构成一个独立的集合...
分类:其他好文   时间:2014-09-21 17:40:11    阅读次数:881
Shodan:搜索互联网背后通道
“当人们通过谷歌找不到某些信息时,他们会认为没人能找到。但这不是真的。” ——搜索引擎Shodan创始人John Matherly     Shodan被媒体称作互联网上“最惊人的搜索引擎”。与谷歌不同,Shodan帮助人们查看互联网的背后通道 ,因此可以被称作“暗世界的谷歌”。Shodan关注服务器、摄像头、打印机、路由器,以及所有一切连接至互联网,并成为互联网组成元素的东西。...
分类:其他好文   时间:2014-09-21 16:53:10    阅读次数:244
PageRank算法
1. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左側排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模...
分类:其他好文   时间:2014-09-21 15:40:30    阅读次数:241
二十、【.Net开源】EFW框架核心类库之WebService服务
回《【开源】EFW框架系列文章索引》 EFW框架源代码下载V1.1:http://pan.baidu.com/s/1qWJjo3UEFW框架实例源代码下载:http://pan.baidu.com/s/1o6MAKCa EFW框架中的WebService服务开发方式与传统的net项目中开发不...
分类:Web程序   时间:2014-09-21 13:12:40    阅读次数:396
linux随笔(10)---find等查找命令
which使用环境变量查找可执行文件的路径;whereis查找可执行文件、源代码、man文件的路径;find命令能够查找文件系统中的任何文件,支持正则表达式查找;locate命令通过之前建立的索引查找文件,所以比find快,但是不适合查找最近新建或者重命名的文件。...
分类:系统相关   时间:2014-09-21 11:52:10    阅读次数:238
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!