Hash索引 主要就是通过Hash算法(常见的Hash算法有直接定址法、平方取中法、折叠法、除数取余法、随机数法),将数据库字段数据转换成定长的Hash值,与这条数据的行指针一并存入Hash表的对应位置;如果发生Hash碰撞(两个不同关键字的Hash值相同),则在对应Hash键下以链表形式存储。 检 ...
分类:
数据库 时间:
2020-09-08 20:50:17
阅读次数:
46
搜索引擎三大过程 爬取内容、进行分词、建立倒排索引。 分词器 分词器使用IK,通常为了保证索引时覆盖度和搜索时准确度,索引分词器采用ik_max_word,搜索分析器采用ik_smart模式。可在IK的配置文件中配置自定义的词典、停词词典。 倒排索引 Elasticsearc依赖Lucene建立倒排 ...
分类:
其他好文 时间:
2020-09-07 19:19:25
阅读次数:
60
1 优化SQL语句的一般步骤 1.1 通过 show status命令了解各种SQL的执行频率 ? MySQL客户端连接成功后,通过show[session|global]status命令可以提供服务器状态信息 # 所有存储引擎的表统计信息 show status like 'Com_%'; # I ...
分类:
数据库 时间:
2020-09-07 19:00:18
阅读次数:
39
虚拟机内存结构简图 PC寄存器作用 PC寄存器用来存储指向下一条指令的地址,也即将要执行的指令代码,由执行引擎读取下一条指令。 简介 它是一块很小的内存空间,几乎可以忽略不计。也是运行速度最快的存储区域。 在JVM规范中,每个线程都有它自己的程序计数器,是线程私有的,声明周期与线程的声明周期保持一致 ...
分类:
其他好文 时间:
2020-09-07 18:47:45
阅读次数:
48
1.创建全文索引(FullText index) 旧版的MySQL的全文索引只能用在MyISAM表格的char、varchar和text的字段上。 不过新版的MySQL5.6.24上InnoDB引擎也加入了全文索引,所以具体信息要随时关注官网, 1.1. 创建表的同时创建全文索引 CREATE TA ...
分类:
数据库 时间:
2020-09-04 17:38:16
阅读次数:
73
1在pom.xml中添加依赖 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-thymeleaf</artifactId> </dependency> 2在applica ...
分类:
编程语言 时间:
2020-09-04 17:27:22
阅读次数:
48
今天有人说可以利用 html 页面的中 meta 标签来屏蔽搜索引擎蜘蛛的抓取或不让蜘蛛抓取网页中的其它链接,本着好奇的精神,就查了一些相关的资料,发现了一串类似 <meta name='robots' content='noindex,nofollow' /> 这样的HTML代码,可以告诉来网页爬 ...
分类:
Web程序 时间:
2020-09-04 17:26:50
阅读次数:
57
Hive是大数据领域常用的组件之一,主要用于大数据离线数仓的运算,关于Hive的性能调优在日常工作和面试中是经常涉及的一个点,因此掌握一些Hive调优是必不可少的一项技能。影响Hive效率的主要因素有数据倾斜、数据冗余、job的IO以及不同底层引擎配置情况和Hive本身参数和HiveSQL的执行等。本文主要从建表配置参数方面对Hive优化进行讲解
分类:
其他好文 时间:
2020-09-04 16:58:58
阅读次数:
42
Intezer研究人员发现一款利用无文件技术来绕过检测的Linux恶意软件——Doki。自2020年1月14日上传到VirusTotal后,先后有60个恶意软件检测引擎对其就进行了检测分析。Doki成功绕过了这些引擎的检测,其***的目标主要是公有云平台上的Docker服务器,包括AWS、Azure和阿里云。Docker是Linux和Windows平台的一种PaaS解决方案,开发者利用它可以在隔离的
分类:
系统相关 时间:
2020-09-04 16:57:17
阅读次数:
53
主攻个人数据分布式存储的HDFS的优势在哪?互联网的纪元中,数据就是一切,互联网环境下任何人的一切活动都会在网络中留下属于自己的印迹—数据碎片,这些我们不经意间留下的数据碎片如果被有心人收集、利用起来会对我们个人的兴趣爱好甚至是隐私产生不利的影响。不知道你有没有这样的体验,当你用搜索引擎了解某种商品之后,某些电商平台会给你不断的推送类似的商品,显然这不是巧合而是你的某些数据“出卖”了你的意图。随着
分类:
其他好文 时间:
2020-09-02 16:46:50
阅读次数:
47