MySQL索引

时间：2018-09-29 19:20:41 阅读：133 评论：0 收藏：0 [点我收藏+]

标签：临时表正文空值 not 汉语是什么相同 cluster 高效

查阅书籍及文章，做下记录吧，方便熟悉，以免忘了。

索引

索引是什么？能帮助我们解决什么问题？
索引是对数据库的一列或多列的值进行排序定位的存储结构，索引是一种特殊的文件(InnoDB数据表上的索引是表空间的一个组成部分)，它们包含着对数据表里所有记录的引用指针解决大数据下的快速查询。就像是书的目录一样，通过索引查找到正文的页数。

1. 索引结构方法

B-Tree

按顺序存贮数据。

索引的最左列查找，若不是，无法使用索引。如:‘like name=%Ja%‘。
若查询中有某一列的范围查询，则最右边所有列都不能使用索引优化查找。如：WHERE last_name = ‘Smith‘ and first_name LIKE ‘J%‘ AND dob=‘1976-12-23‘,like是一个范围查找，前两列可使用索引查找，后面列无法使用索引。
不能跳过索引中的列。

hash index

哈希索引基于哈希表实现，只有精确匹配索引所有列的查询才有效。对每行数据，存贮引擎都会对所有的索引列计算一个哈希码（较小值）。哈希索引将所有的哈希码存储到索引中，同时在哈希表中保存指向的数据行的指针。

R-Tree(空间索引)

和B-Tree不同，这类索引无需前缀查询。空间索引会从所有维度来索引数据，查询时可以使用任意维度组合查询。 MyISAM支持空间索引，可用作地理数据存贮。

全文索引

全文索引是一种特殊类型的索引，查找的文本中的关键词，而不是直接比较索引中的值。
在相同列上同事建全文索引和B-Tree索引不会有冲突，全文索引适用于MATCH AGAINST操作，而不是普通通的WHERE条件操作。

2. 索引类型

B+tree索引分为聚集索引与非聚集索引两大类。

理解聚集索引和非聚集索引可通过对比汉语字典的索引。汉语字典提供了两类检索汉字的方式，第一类是拼音检索（前提是知道该汉字读音），比如拼音为cheng的汉字排在拼音chang的汉字后面，根据拼音找到对应汉字的页码（因为按拼音排序，二分查找很快就能定位），这就是我们通常所说的字典序；第二类是部首笔画检索，根据笔画找到对应汉字，查到汉字对应的页码。拼音检索就是聚集索引，因为存储的记录（数据库中是行数据、字典中是汉字的详情记录）是按照该索引排序的；笔画索引，虽然笔画相同的字在笔画索引中相邻，但是实际存储页码却不相邻。

聚集索引

并不是一种单独的索引类型，而是一种数据存储方式。InnoDB的聚集索引实际是在同一个结构中保存了B-Tree索引和数据行。

一种索引，该索引中键值的逻辑顺序决定了表中相应行的物理顺序。
数据行的物理顺序与列值（一般是主键的那一列,mysql默认主键就是聚集索引）的逻辑顺序相同，一个表中只能拥有一个聚集索引。
技术分享图片
特性：

MySQL如果定义主键，那么主键就是聚集索引；

MySQL如果没有定义主键，表中第一个唯一非空索引就作为聚集索引；

MySQL如果没有主键也没有合适的唯一索引，那么innodb内部会生成一个隐藏的主键作为聚集索引，这个隐藏的主键是一个6个字节的列，改列的值会随着数据的插入自增；

使用UUID聚集索引,主键值是乱序的，B-Tree的页数分行，重新排列，频繁的页分裂，变得复杂。

技术分享图片

==MySQL的索引分为B+树索引和hash索引与全文索引。MyISAM数据库引擎和InnoDB数据库引擎的索引都是基于B+树的。==

MyISAM、InnoDB引擎、Memory三个常用引擎类型比较

索引	MyISAM引擎	InnoDB引擎	Memory引擎
B-Tree 索引	支持	支持	支持
HASH 索引	不支持	支持	支持
R-Tree 索引	支持	不支持	不支持
Full-text 索引	不支持	暂不支持	不支持

非聚集索引

一种索引，该索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同。

聚集索引与非聚集索引区别

聚集索引一个表只存在一个，而非聚集索引一个表可以存在多个；
聚集索引的叶节点是最终的数据节点，而非聚集索引（二级索引）的叶节点仍然是索引节点，但它有一个指向最终数据的指针；所以获取数据速度聚集索引比较快。（二级索引子节点保存不是指向行的物理位置的指针，而是行的主键值。）
使用聚集索引来做查询操作时速度很快，但是做插入操作较为费事；
InnoDB支持聚集索引，MyISAM不支持聚集索引。
更新聚集索引的列代价很高，InnoDB会强制将每一个更新的行移动到新的位置；

1). 唯一索引

数据列不允许重复，允许为NULL值，一个表允许多个列创建唯一索引。

#创建唯一索引
ALTER TABLE table_name ADD UNIQUE (column);

#创建唯一组合索引
ALTER TABLE table_name ADD UNIQUE (column1,column2);

2). 主键索引

不允许有空值的唯一索引。(==在B+TREE中的InnoDB引擎中,主键索引起到了至关重要的地位==)

3). 全文索引

是目前搜索引擎使用的一种关键技术。

ALTER TABLE table_name ADD FULLTEXT (column);

4). 普通索引

MySQL中基本索引类型，没有什么限制，允许在定义索引的列中插入重复值和空值，纯粹为了查询数据更快一点。

ALTER TABLE table_name add INDEX (column)

5). 组合索引

在表中的多个字段组合上创建的索引，只有在查询条件中使用了这些字段的左边字段时，索引才会被使用，使用组合索引时遵循==最左前缀==集合

ALTER TABLE table_name INDEX ( column1,column2 )

6). 空间索引

空间索引是对空间数据类型的字段建立的索引，MySQL中的空间数据类型有四种，GEOMETRY、POINT、LINESTRING、POLYGON。在创建空间索引时，使用SPATIAL关键字。要求，引擎为MyISAM，创建空间索引的列，必须将其声明为NOT NULL。

7). 前缀索引

有时候需要索引很长的字符列，这会让索引变得大且慢。索引开始的部分字符，大大节约索引空间，提高索引效率。

ALTER TABLE table_name ADD INDEX(column(prefix_length));

3. 索引优点

大大减少了服务器需要扫描的数量；
可以帮助服务器避免排序和临时表；
可以将随机I/O变成顺序I/O；

4. 索引策略

避免重复索引（列建多个索引）

独立的列

指索引列不能是表达式的一部分或是某个函数的参数。如：

SELECT * FROM user WHERE age+1=23;

前缀索引和索引选择性

计算合适的前缀长度，并使前缀的选择性接近于完整列的选择性。对于BLOB、TEXT、VARCHAR这些类型的列，必须使用前缀索引，mysql不允许索引这些列的完整长度。

选择合适的索引列顺序

对于联合索引，如何决定索引字段的顺序：

选择性和基数的经验法则：将选择性最高的列放到索引最前列（业务上常用的，如：某个网站根据不同性别，展示不同内容的 sex肯定要作为组合索引前列）；
WHERE子句中的排序、分组、范围条件等因素。（明显缩短查找范围）

选择性

索引的选择性（==Selectivity==），是指不重复的索引值（也叫基数，Cardinality）与表记录数（#T）的比值：

Index Selectivity = Cardinality / #T

显然选择性的取值范围为(0,1]，选择性越高的索引价值越大，这是由B+Tree的性质决定的。
如图：

技术分享图片

覆盖索引

索引查找数据高效的方式，MySQL也可以根据索引直接获取到数据，这样就不比再去读取数据行。如果一个索引包含了所需要查询字段的值，我们就叫做覆盖索引。（减少了二次查询）

举例：学生成绩表(StudentScore)包含字段：id、username、score、subject；索引 clustered index(id) index(username)

#非聚集索引节点直接获取列数据
SELECT id,username FROM StudentScore WHERE username='小米'
SELECT username FROM StudentScore WHERE username='小米'

#二次查询
SELECT id,username,score FROM StudentScore WHERE username='小米'