前面一篇开始学习solr的时候,做了个入门的示例http://blog.csdn.net/zjc/article/details/24414271 。虽然可以检索出内容,但总和想象的结果有差异——比如,检索“天龙”两个字,按常规理解,就应该只出来《天龙八部》才对,可是竟然也会把《倚天屠龙记》检出来。后来研究了一下,发现系统是这样处理的:无论是抽索引时还是分析检索词时,都把所有文字按单字拆开。这样,...
分类:
其他好文 时间:
2014-05-26 06:11:39
阅读次数:
270
现在有越来越多的人热衷于做网络爬虫(网络蜘蛛),也有越来越多的地方需要网络爬虫,比如搜索引擎、资讯采集、舆情监测等等,诸如此类。网络爬虫涉及到的技术(算法/策略)广而复杂,如网页获取、网页跟踪、网页分析、网页搜索、网页评级和结构/非结构化数据抽取以及后期更细粒度的数据挖掘等方方面面,对于新手来说,不...
分类:
Web程序 时间:
2014-05-26 05:54:50
阅读次数:
393
很多人以为i标签和em标签都只是HTML用于斜体的标签,并不知道他们有什么区别。其实对于熟悉SEO的人来说,他们的区别挺大的(普通用户略过)。i标签的作用:仅仅是为了让字体显示斜体,对于SEO没什么作用。em标签的作用:不仅可以让字体显示斜体,而且可以加强语气,告诉搜索引擎这里是重要的。
分类:
其他好文 时间:
2014-05-26 05:44:51
阅读次数:
254
你要好好的思考,及其在百度更接近完美的时候就更要做好这些,其实这些都是影响用户体会的要素。一个成功的网站可以说它在收取利益的同时也在帮助用户。现在说说网站权重有何重要性呢?其实搜索引擎给网站(包含页面)赋予一定的威望值,对网站(含页面)威望的评价,一个网站权重越高,在搜索引擎所占的价值成分就越好,在搜索引擎排行就越好。一个网站在搜索引擎中的权重是件非常艰难的工作,因为种种要素的搅扰,影响了咱们正确...
分类:
Web程序 时间:
2014-05-26 04:42:45
阅读次数:
307
从昨天晚上还是叼coreseek,结果一直出现很奇怪的问题,结果晚上觉都没睡好。
在命令行下可以搜索成功,但一旦调用API以后,就会很奇怪的问题,无论是字段还是原来的属性都没出现过,出现的是以前的情况。索引建立也是成功的,端口也在监听,结果却一直有问题。在我们实验室大哥跟二哥合力一个多小时之下终于找到了问题。
在任务管理器下停止服务时,仍然可以调用API搜索,!!!说明searchd服务没有被...
分类:
其他好文 时间:
2014-05-26 03:12:00
阅读次数:
254
索引、实体化视图、簇、散列簇、序列、同义词1、创建表CREATE TABLE (
,……);CREATE GLOBAL TEMPORARY TABLE ( ,……) ON COMMIT DELETE ROWS TABLESPACE
;--创建事务级临时表,事务提交后删除临时表中数据CREATEGLO...
分类:
数据库 时间:
2014-05-25 23:25:14
阅读次数:
455
所谓学习问题,是指观察由n个样本组成的集合,并根据这些数据来预测未知数据的性质。学习任务(一个二分类问题):区分一个普通的互联网检索Query是否具有某个垂直领域的意图。假设现在有一个O2O领域的垂直搜索引擎,专门为用户提供团购、优惠券的检索;同时存在一个通用的搜索引擎,比如百度,通用搜索引擎希望能...
分类:
其他好文 时间:
2014-05-25 23:18:41
阅读次数:
468
在实际应用中,数据库中的数据会有很多,若要从这些数据表中检索数据,就需要对系统进行优化,提高数据库系统的响应速度,下面就是日常一些查询优化的方法。
1.创建索引
索引可以提高数据库查询的速度,提高数据库的访问性能,但同时也会影响数据更新操作(例如插入、修改、删除)的速度。
如果WHERE子句中经常用到的某一列或者某几列创建索引...
分类:
数据库 时间:
2014-05-25 16:44:01
阅读次数:
315
本文章原创,引用转载请注明作者出处。这两天写了一个小的C++程序,用的开发工具是visual
studio。个人感觉Microsoft做的visual
studio真心的很强大,推荐大家在开发c\c++,以及c#,asp.net等一些软件的时候可以使用visual studio.说一下我开发的的程序...
分类:
其他好文 时间:
2014-05-25 03:28:01
阅读次数:
295
ASM单点故障
经常由用户询问如何避免ASM单点故障的最佳实践。与其他文件系统或卷管理器一样
ASM实例失效会导致运行在上面的RDBMS实例不可用。然而OS 文件系统或卷管理器失效
一般会伴随操作系统崩溃,而asm重启不需要重启服务器。
解决ASM单点故障的最好的办法是把ASM运行在RAC环境通过集群实现高可用。ASM可以
继续运行在其他节点如果一个节点重启或rdbms重启。ASM失效是...
分类:
数据库 时间:
2014-05-25 00:22:13
阅读次数:
489