SQL Server创建索引http://blog.csdn.net/lenotang/article/details/3329501
分类:
其他好文 时间:
2014-06-26 22:58:24
阅读次数:
160
数天前,百度站长平台发布“正确理解索引量工具”一文,称索引量仅指被百度搜索引擎建立了索引的网页总量,表示网站中有多少页面可以作为搜索候选结果,不同网页因内容重要性、稀缺性不同,被展现的几率有很大差别。换句话说,既使你的网站有1亿个网页被建立索引,也许真正能获得流量的仅有100个页面。 该文章一经发布...
分类:
Web程序 时间:
2014-06-26 22:47:22
阅读次数:
397
中文分词是做好中文内容检索、文本分析的基础,主要应用于搜索引擎与数据挖掘领域。中文是以词为基本语素单位,而词与词之间并不像英语一样有空格来分隔,因而中文分词的难点在于如何准确而又快速地进行分词以下介绍4款开源中文分词系统。1、ICTCLAS – 全球最受欢迎的汉语分词系统 中文词法分析是中文信息处理...
分类:
其他好文 时间:
2014-06-26 22:35:29
阅读次数:
298
def ghi abc def ghi当tr的display:block时,colspan会失效,所以一般遇到table需要设置tr为block时,改为“table-row”即可。运用在这个案例中.
分类:
其他好文 时间:
2014-06-26 22:13:49
阅读次数:
715
作用:DBMS_STATS.GATHER_TABLE_STATS统计表, 列,索引的统计信息.DBMS_STATS.GATHER_TABLE_STATS的语法如下:DBMS_STATS.GATHER_TABLE_STATS ( ownname VARCHAR2, tabname VARCHAR2,....
分类:
数据库 时间:
2014-06-26 21:18:02
阅读次数:
259
MERGE存储引擎把一组MyISAM数据表当做一个逻辑单元来对待,让我们可以同时对他们进行查询。构成一个MERGE数据表结构的各成员MyISAM数据表必须具有完全一样的结构。每一个成员数据表的数据列必须按照同样的顺序定义同样的名字和类型,索引也必须按照同样的顺序和同样的方式定义。假设你有几个日志数据...
分类:
数据库 时间:
2014-06-26 20:34:11
阅读次数:
287
一直没有好好关注这个功能,昨天看了一下,数据库插入有瓶颈,今天研究了一下:主要有以下方案:1.使用copy从文件导入:copy table_001(a, b, "f", d, c, "e") from 'd:/data1.txt' (delimiter ','); 速度极快: 不带索引: 查询...
分类:
数据库 时间:
2014-06-26 19:54:31
阅读次数:
392
在LINUX系统中,有许多场合都使用时间戳的方式表示时间,即从1970年1月1日起至当前的天数或秒数。如/etc/shadow里的密码更改日期和失效日期,还有代理服务器的访问日志对访问时间的记录等等。下面介绍几种时间戳格式和标准时间格式转换的方法:1、分别以标准格式和时间戳来显示当前时间[root@...
分类:
系统相关 时间:
2014-06-26 14:48:27
阅读次数:
325
一 应用无状态(淘宝session框架) 假如在session中保存了大量与客户端的状态信息,保存状态信息的server宕机时 通常通过集群解决,不仅有负载均衡,更重要的是要有失效恢复failover tomcat用集群节点广播复制,jboss用配对复制等session状态复制策略,但严重影响...
分类:
其他好文 时间:
2014-06-26 14:43:48
阅读次数:
198
垂直搜索引擎研发经验总结
什么是垂直搜索引擎?
垂直搜索引擎是针对某一行业的搜索引擎,是搜索引擎的细化和延伸,是对网页库中的某类信息进行一次整合,定向分字段抽取出所需要的数据,再进行二次处理和索引,最后根据用户提交的请求,返回搜索结果。
与普通的网页搜索引擎相比,它们最大的区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结...
分类:
其他好文 时间:
2014-06-26 07:38:14
阅读次数:
294