BaikalDB是一个分布式可扩展的存储系统,支持PB级结构化数据的随机实时读写。 提供MySQL接口,支持常用的SELECT,UPDATE,INSERT,DELETE语法。提供各种WHERE过滤、GROUP BY聚合,HAVING过滤,ORDER BY排序等功能,用户可以组合实现各种在线OLAP需 ...
分类:
数据库 时间:
2019-11-19 01:24:34
阅读次数:
183
Elasticsearch是什么? Elasticsearch简称ES,是一个基于Lucene构建的开源、分布式、Restful接口的全文搜索引擎,还是一个分布式文档数据库。天生就是分布式、高可用、可扩展的,可以在很短的时间内存储、搜索和分析大量的数据。 什么是全文搜索? 全文搜索也叫全文检索,是指 ...
分类:
其他好文 时间:
2019-11-14 09:52:26
阅读次数:
62
全文检索,elasticsearch,elasticserach-5.5.0,elasticsearch-analysis-ik ...
分类:
其他好文 时间:
2019-11-05 16:43:17
阅读次数:
92
Elasticsearch也是基于Lucene的全文检索库,本质也是存储数据,很多概念与MySQL类似的。 对比关系: 索引(indices) Databases 数据库 ? 类型(type) Table 数据表 ? 文档(Document) Row 行 ? 字段(Field) Columns 列 ...
分类:
其他好文 时间:
2019-11-04 22:00:49
阅读次数:
106
全文检索技术被广泛的应用于搜索引擎,查询检索等领域。我们在网络上的大部分搜索服务都用到了全文检索技术。
对于数据量大、数据结构不固定的数据可采用全文检索方式搜索,比如百度、Google等搜索引擎、论坛站内搜索、电商网站站内搜索等。
分类:
其他好文 时间:
2019-10-30 18:38:35
阅读次数:
109
1.1 Solr是什么 Solr是一个基于全文检索的企业级应用服务器。可以输入一段文字,通过分词检索数据。它是单独的服务,部署在 tomcat。 1.2 为什么需要Solr 问题:我们已经学过Lucene,为什么还要学习solr? Lucene是一个工具包,不能单独运行,需要导入到java代码中。S ...
分类:
其他好文 时间:
2019-10-23 18:24:48
阅读次数:
83
一、信息检索概述 1、信息过载 据百度百科介绍,信息过载是指社会信息超过了个人或系统所能接受、处理或有效利用的范围,并导致故障的状况。 信息过载有以下3个特点 (1)受传者对信息反映的速度远远低于信息传播的速度; (2)大众媒介中的信息量大大高于受众所能消费、承受或需要的信息量; (3)大量无关的没 ...
分类:
其他好文 时间:
2019-10-21 19:18:05
阅读次数:
91
一.本项目涉及编程语言java,scala,python,涉及的技术如下: 1.微服务架构: springboot springcloud mybatisplus shiro 2.全文检索技术 solr 3.日志系统技术 elk 4.消息中间件 kafka 5.数据库技术 mysql redis m ...
分类:
其他好文 时间:
2019-10-13 13:14:22
阅读次数:
99
Django之使用haystack+whoosh实现搜索功能,本文介绍的是如何通过搜索框来实现搜索功能,比如当我们的商城项目呀搜索商品时,或者论坛项目要搜索帖子时使用。内容包括 全文检索框架和引擎的安装和配置,生成索引文件,使用全文检索,以及使用中文分词包jieba等。 ...
分类:
其他好文 时间:
2019-10-07 11:17:48
阅读次数:
87