首先使用composer安装扩展 composer require elasticsearch/elasticsearch composer require nunomaduro/collision 开启你的 elasticsearch 与 kibana HTML代码 使用vue进行数据渲染 <!d ...
分类:
其他好文 时间:
2021-03-17 14:12:05
阅读次数:
0
0.场景说明 centos7 mysql5.7 InnoDB引擎 0.1创建表 DROP TABLE IF EXISTS tbl_article_content; CREATE TABLE tbl_article_content ( id bigint(40) NOT NULL AUTO_INCRE ...
分类:
数据库 时间:
2021-01-11 11:20:40
阅读次数:
0
文章搜索我现在使用的是mysql的模糊查询like搜索标题关键字。 之前也有用全文索引,但是全文索引的效率比较低,所以,后期就没有在对文章内容进行匹配。 后来接触到中文分词器,感觉他刚好能解决我的问题:目前比较好的支持PHP的分词器大概有solr(基于Java开发),sphinx(基于C++开发) ...
分类:
其他好文 时间:
2021-01-11 10:52:57
阅读次数:
0
ELSA(全称:EnterpriseLogSearchandArchive)是一款基于syslog-ng(新一代日志收集器,但目前多数Linux发现版都不带此工具)、MySQL的开源级企业日志归档查询工具,由于它和Sphinx的完美搭配,支持全文索引可以像搜索Web一样轻松地搜索上亿个日志中的任意字符串(前提是你的服务器配置足够高)。单节点ELSA日志采集系统的工作原理图如下所示:上面这张架构图可
分类:
其他好文 时间:
2020-12-16 12:26:48
阅读次数:
3
1.什么是Lucene?作为一个开放源代码项目,Lucene从问世之后,引发了开放源代码社群的巨大反响,程序员们不仅使用它构建具体的全文检索应用,而且将之集成到各种系统软件中去,以及构建Web应用,甚至某些商业软件也采用了Lucene作为其内部全文检索子系统的核心。apache软件基金会的网站使用了Lucene作为全文检索的引擎,IBM的开源软件eclipse的2.1版本中也采用了Lucene作为
分类:
Web程序 时间:
2020-12-04 11:11:11
阅读次数:
11
1.倒排索引 搜索引擎中存储的是倒排索引,就是分好的词,和词语文章的关联 事先把文章使用分词打散,以词为依据,标记清楚对应的文章的编号 查询时 把查询的语句也进行分词,然后根据分词,找到那些文章中包含了这些词 2.django创建全文索引的过程 1.django中提供的是结构化数据(mysql中) ...
分类:
其他好文 时间:
2020-11-17 12:13:16
阅读次数:
6
MySQL5.6,应该实现在最流行的版本吧?很遗憾有一些功能一直没有,例如:哈希索引T-tree索引原生高可用auto-sharding...画外音:你最希望看到支持什么特性?但,5.6版本中,InnoDB有些有意思的特性,或许是大伙还不清楚的。从这个版本开始,可以支持全文索引了。altertable可以不拷贝表了,且不阻塞写操作,onlineDDL,酷炫吧。画外音:并不是所有的altertabl
分类:
数据库 时间:
2020-11-17 12:03:10
阅读次数:
10
继续回答星球水友提问。沈哥,我们有个业务,类似于“标题分词检索”,并发量非常大,大概20W次每秒,数据量不是很大,大概500W级别,而且数据不会频繁更新,平均每天更新一次,请问有什么好的方案么?这是一个典型的,短文本分词搜索的问题,简单聊聊自己的经验。常见的文本检索方案有哪些?(1)数据库LIKE法将标题数据存放在数据库中,使用like来查询,方案非常简单,能支持简单的模糊搜索,但不支持分词。画外
分类:
其他好文 时间:
2020-11-10 11:31:19
阅读次数:
7
1.搜索引擎工作原理 1.倒排索引 搜索引擎中存储的是倒排索引,就是分好的词,和词语文章的关联 事先把文章使用分词打散,以词为依据,标记清楚对应的文章的编号 查询时: 把查询的语句也进行分词,然后根据分词,找到那些文章中包含了这些词 2.django创建全文索引的过程 1.django中提供的是结构 ...
分类:
其他好文 时间:
2020-10-19 22:47:05
阅读次数:
18
Hash索引 主要就是通过Hash算法(常见的Hash算法有直接定址法、平方取中法、折叠法、除数取余法、随机数法),将数据库字段数据转换成定长的Hash值,与这条数据的行指针一并存入Hash表的对应位置;如果发生Hash碰撞(两个不同关键字的Hash值相同),则在对应Hash键下以链表形式存储。 检 ...
分类:
数据库 时间:
2020-09-08 20:50:17
阅读次数:
46