本篇是本人对Solr的使用进行的调研,具体包括
使用DataImportHandler从数据库中近实时同步数据、测试Solr创建索引的效率、以及测试Solr的搜索效率等。
具体的搜索引擎概念、Solr搭建方法、数据库mysql使用方法,假设读者已有了基础
分类:
其他好文 时间:
2014-05-23 03:24:30
阅读次数:
398
Dfs:大部分是直接递归枚举,即求满足约束条件下的解,虽不用剪枝,但也需要代码能力。练习递归枚举的题目:1241
Oil Deposits (dfs的连通块个数)1016 Prime Ring Problem1584
蜘蛛牌(简单dfs,简单的剪枝,还有人用DP做(???))1426 Sudoku ...
分类:
其他好文 时间:
2014-05-23 02:54:33
阅读次数:
301
MySQL各种索引(因为是浅析大多都不刻意区分搜索引擎)
INDEX(普通索引):最基本的索引,没有任何限制
ALTER TABLE `table_name` ADD INDEX index_name ( `column` )
UNIQUE(唯一索引):与"普通索引"类似,不同的就是:索引列的值必须唯一,但允许有空值。
ALTER TABLE `table_name` ADD UNIQUE (`column`)
注:创建唯一索引的目的不是为了提高访问速度,而只...
分类:
数据库 时间:
2014-05-23 01:24:44
阅读次数:
313
几年前,雷·库兹韦尔写过一本书叫做《奇点临近》。他说,人类文明经过这么多年发展,在本世纪的中叶会经过一个点,这个点,就是奇点。奇点是一个拐点,也就是说人类文明可能会进入一个分岔,可能会进入一个新的文明高度,也可能会急转直下,人类就此灭亡。所以奇点有双重的含义,有可能变得更好,也有可能变得更糟糕。
进入微软、亚马逊,谷歌等美国IT企业工作人才项目,起薪40万,百度搜索(MUMCS)
...
分类:
其他好文 时间:
2014-05-23 01:01:56
阅读次数:
256
在google诞生以前,传统搜索引擎主要依靠页面内容中的关键词匹配搜索词进行排名。这种排名方式的短处现在看来显而易见,那就是很容易被刻意操纵。黑帽SEO在页面上推挤关键词,或加入与主题无关的热门关键词,都能提高排名,使搜索引擎排名结果质量大为下降。现在的搜索引擎都使用链接分析技术减少垃圾,提高用户体验。下面泡馆史明星就来简单的介绍链接在搜索引擎排名中的应用原理。
在排名中计入链接因素,不仅有...
分类:
其他好文 时间:
2014-05-23 00:19:53
阅读次数:
333
入微软、亚马逊,谷歌等美国IT企业工作人才项目,起薪40万,百度搜索(MUMCS)
英文原文:How innovation will shape the future of business: ESADE Business School Commencement Speech
作者:史蒂夫·布兰克(Steve Blank),硅谷连续创业者、学者,《创业者手册》合著者。本文是布兰...
分类:
其他好文 时间:
2014-05-23 00:12:43
阅读次数:
414
截止目前,已完成如下功能:
1、指定某个地址,下载其页面中包含的所有链接指向的网页
主要有以下类:
1、主类MyCrawler
2、网页下载类PageDownloader
3、网页内容分类类HtmlParserTool
4、接口Filter
完整代码可见归档代码 Jediael_v0.01
或者
https://code.csdn.net/jediael_lu/d...
分类:
其他好文 时间:
2014-05-22 23:19:37
阅读次数:
268
² 字符函数
1. replace( 字符串1,字符串2,字符串3)
replace( char, search_string, replace_string)
功能:在“字符串1”中搜索“字符串2”,并将其替换为“字符串3”。
例如下面的命令是将所有员工名字中出现的”A”替换为”中国”。
SQL>selectreplace(ename, 'A', '中国') fro...
分类:
数据库 时间:
2014-05-22 22:35:22
阅读次数:
450
作者jetz
在各类应用软件的开发中,字符串操作是最常见的操作之一。在各种不同的数据类型中,字符串类型是和现实世界关联最紧密的。对字符串的读入、比较、拼接、搜索、匹配、替换、拆分等操作,是每个程序员必须要掌握的基本功。而C#的字符串处理,在历经了微软的多种开发工具的多年的积累后,达到了一个新的高度,概念上既简单明了,功能上又强大易用。大多数的字符串操作,都可以轻松应对。
在基本的字符串...
分类:
其他好文 时间:
2014-05-22 22:34:03
阅读次数:
317
一、我们先回顾下SVM问题。
A、线性可分问题
1、SVM基本原理:
SVM使用一种非线性映射,把原训练 数据映射到较高的维。在新的维上,搜索最佳分离超平面,两个类的数据总可以被超平面分开。
2、问题的提出:
3、如何选取最优的划分直线f(x)呢?
4、求解:凸二次规划
建立拉格朗日函数:
求偏导数:
...
分类:
其他好文 时间:
2014-05-22 17:10:54
阅读次数:
475