数据库是数据持久化必不可少的方式, 如果是开发一定要详细的掌握, 熟练的使用sql语句达到用户的需求。
分类:
数据库 时间:
2014-10-03 21:58:55
阅读次数:
299
注明:本文是由本人在开发有关基于lucene资源检索系统时的一点总结,当中一部分是自己依据开发过程自己总结的,也有部分是摘自网络,因无法获取当时摘文的地址,所以在此没有写源地址。转载请声明出处Lucene-3.0.0配置一、Lucene开发环境配置step1.Lucene开发包下载step2.Jav...
分类:
其他好文 时间:
2014-10-03 15:32:14
阅读次数:
361
人物介绍姓名:DougCutting个人名望:开发出开源全文检索引擎工具包Lucene。个人简介/主要荣誉:除了 Lucene,还开发了著名的网络爬虫工具 Nutch,分布式系统基础架构Hadoop,这些大师级作品都是开源的。目前任职 Apache 软件基金会主席。网络上对 Doug Cutting...
分类:
其他好文 时间:
2014-10-03 13:28:14
阅读次数:
368
为什么要创建索引呢?这是由于,创建索引能够大大提高系统的性能。 第一,通过创建唯一性索引,能够保证数据库表中每一行数据的唯一性。 第二,能够大大加快 数据的检索速度,这也是创建索引的最基本的原因。 第三,能够加速表和表之间的连接,特别是在实现数据的參考完整性方面特别有意义。 第四,在使用分组和排序 ...
分类:
数据库 时间:
2014-10-02 22:06:23
阅读次数:
245
应用优化: 使用连接池: 使用数据库连接池,可以复用数据库连接对象,从而减少创建新连接带来的资源消耗。 减少对MySQL的访问: 避免对同一数据做重复检索: 理清应用的业务逻辑,尽量减少查询次数。 使用查询缓存...
分类:
数据库 时间:
2014-10-02 13:59:03
阅读次数:
206
1 nginx的基数树简介
基数树是一种二叉查找树,它具备二叉查找树的所有优点:检索、插入、删除节点速度快,支持范围查找,支持遍历等。在nginx中仅geo模块使用了基数树。nginx的基数树使用ngx_radix_tree_t这个结构体表示的。ngx_radix_tree_t要求存储的每个节点都必须以32位整形作为区别任意两个节点的唯一标识。ngx_radix_tree_t基数树会负责分配每个...
分类:
其他好文 时间:
2014-10-01 18:19:41
阅读次数:
235
ExecuteScalar运行查询,并返回查询所返回的结果集中第一行的第一列或空引用(假设结果集为空).忽略其它列或行.使用 ExecuteScalar 方法从数据库中检索单个值。由于不用创建行集、查找值并关闭行集,所以产生的系统开销很小与使用 ExecuteReader方法,然后使用 SqlDat...
分类:
其他好文 时间:
2014-10-01 16:27:41
阅读次数:
148
基础知识搜索引擎搜索引擎爬虫会检索各个网站,分析他们的关键字,从一个连接到另一个连接,如果爬虫觉得这个关键字是有用的 就会存入搜索引擎数据库,反之如果没用的、恶意的、或者已经在数据库的,就会舍弃。搜索引擎数据库 保证是爬虫爬过的最新的数据。用户在使用搜索引擎会在搜索引擎数据库查找关键词,展现给用的的...
分类:
其他好文 时间:
2014-10-01 00:16:40
阅读次数:
187
TF-IDF 加权及其应用TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索的常用加权技术。TF-IDF是一种统计方法,用以评估某个单词对于一个文档集合(或一个语料库)中的其中一份文件的重要程度。单词的重要性随着它在文件中出现的次数成...
分类:
其他好文 时间:
2014-09-30 21:35:50
阅读次数:
237
在使用lucent检索文档时,必须先为各文档创建索引。索引的创建即读出文档信息(如文档名称、上传时间、文档内容等),然后再经过分词建索引写入到索引文件里。这里主要是总结下读取各类文档内容这一步。一、之前做过一个小工具也涉及到读取word和excel内容,采用的是com组件的方式来读取。即导入COM库...
分类:
其他好文 时间:
2014-09-30 18:32:40
阅读次数:
229