最近需要计算制造业领域大词表每个词的idf,词表里一共九十多万个词,语料一共三百七十多万篇分词后文献。最开始尝试用程序词表循环套语料循环得到每个词的idf,后来又尝试把语料存入mysql然后建立全文索引再循环用sql语句去查每个词的idf,效率都十分不理想。 最新的想法是利用solr搜索引擎的速度来 ...
分类:
数据库 时间:
2017-06-05 18:58:04
阅读次数:
182
概述 全文引擎使用全文索引中的信息来编译可快速搜索表中的特定词或词组的全文查询。全文索引将有关重要的词及其位置的信息存储在数据库表的一列或多列中。全文索引是一种特殊类型的基于标记的功能性索引,它是由 SQL Server 全文引擎生成和维护的。生成全文索引的过程不同于生成其他类型的索引。全文引擎并非 ...
分类:
数据库 时间:
2017-06-02 21:07:50
阅读次数:
352
一、业务场景 我们在实际生产环境中遇到了这样一种需求,即需要检索一个父子关系的子树数据 估计大家也遇到过类似的场景,最典型的就是省市数据,其中path字段是按层级关系生成的行政区路径: 如果我们已知某市名,想查出同级和高一级的省名,如保定市同级和上级河北省,那么我们有什么实现方式呢 给大家10秒钟, ...
分类:
数据库 时间:
2017-06-02 21:05:41
阅读次数:
251
一、DML(数据操作语言) InnoDB MyISAM 支持事务 不支持事务 不支持全文索引 支持全文索引 支持外键约束 不支持 命令查看默认存储引擎 show variables like '%storage_engine%'; 1.表中插入数据 #添加课程 INSERT INTO `subjec ...
分类:
数据库 时间:
2017-06-02 12:37:32
阅读次数:
196
最近老大给了一个需求,是要写一个姓名的模糊查询。 问题很简单,难度在于这张表有将近500W条数据。 如果要做中文的模糊查询,效率简直惨不忍睹。 网上查了一下资料,发现全文索引挺符合我的需要的。 结果,使用下来。其实并不太符合我的要求。 全文索引的最小单位是词,如果不是在 in boolean mod ...
分类:
数据库 时间:
2017-06-01 16:51:23
阅读次数:
446
1:INNODB_FT_CONFIG 这张表存的是全文索引的信息,查询前可以先通过以下语句查询一下开启全文索引的表: show variables like 'innodb_ft_aux_table'; 只有两个列还是相当的简单的: name Description KEY The name des ...
分类:
其他好文 时间:
2017-05-28 20:50:11
阅读次数:
254
1、存储结构2、存储空间3、可移植性、备份及恢复4、事务支持5、自增长6、表锁差异7、全文索引8、表主键9、表的具体行数10、CURD操作11、外键MySQL存储引擎中的MyISAM和InnoDB区别详解
分类:
数据库 时间:
2017-05-27 23:57:51
阅读次数:
352
一、查看回收站中表 二、恢复表 注:此方法必须要求Oracle版本必须为9i或10g以上版本,flashback无法恢复全文索引 参见:http://althars.iteye.com/blog/216164 ...
分类:
数据库 时间:
2017-05-20 00:09:14
阅读次数:
273
全文索引-lucene。solr。nutch,hadoop之lucene 全文索引-lucene。solr,nutch,hadoop之solr 我在去年的时候,就想把lucene,solr。nutch和hadoop这几个东东给具体的介绍下,但因为时间的关系。我还是仅仅写了两篇文章,分别介绍了一下lu ...
分类:
Web程序 时间:
2017-05-04 21:51:17
阅读次数:
247