标签:
查询性能优化
1. 为什么查询速度会慢?
1). 如果把查询看作是一个任务,那么它由一系列子任务组成,每个子任务都会消耗一定的时间。如果要优化查询,实际上要优化其子任务,要么消除其中一些子任务,要么减少子任务的执行次数,要么让子任务运行的更快。
2). 通常来说,查询的生命周期大致可以按照顺序来看:从客户端,到服务器端,然后在服务器上进行解析,生成执行计划,执行,并返回结果给客户端。其中"执行"可以认为是整个生命周期中最重要的阶段,这其中包括
大量为了检索数据到存储引擎的调用以及调用后的数据处理,包括排序、分组等。
3). 在完成这些任务的时候,查询需要在不同的地方花费时间,包括网络,CPU计算,生成统计信息和执行计划、锁等待(互斥等待)等操作,尤其是向底层存储引擎检索数据的调用操作,这些调用需要在内存中操作、CPU操作
和内存不足时导致的IO操作上消耗时间,根据上下文不同,可能会产生大量的上下文切换以及系统调用。
2. 慢查询基础:优化数据访问
查询性能低下最基本的原因是访问的数据太多。某些查询可能不可避免地需要筛选大量数据,但这并不常见。大部分性能低下的查询都可以通过减少访问的数量的方式进行优化。对于低效查询,可以通过下面两个步骤来分析:
1). 确认应用程序是否在检索大量超过需要的数据。这通常意味着访问了太多的行,但有时候可能是访问了太多的列。
2). 确认MySQL服务器层是否在分析大量超过需要的数据行。
2.1 是否向数据库请求了不需要的数据
1). 一些典型案例
a. 查询不需要的记录:一个常见的错误是常常会误以为MySQL会只返回需要的数据,实际上MySQL却是返回全部结果集在进行计算。最简单有效的解决方法是在这样的查询后面加上LIMIT。
b. 多表关联时返回全部列
c. 总是取出全部列:每次看到SELECT * 的时候都需要用怀疑的眼光审视,是不是真的需要返回全部列?取出全部列会让优化器无法完成索引覆盖扫描这类优化,还会为服务器带来额外的网络、IO、内存和
CPU的消耗。
d. 重复查询相同的数据:比较好的方案是,当初次查询的时候将这个数据缓存起来,需要的时候从缓存中取出,这样性能会更好。
2.2 MySQL是否在扫描额外的记录:
1). 对于MySQL,最简单的衡量查询开销的三个指标如下:
a. 响应时间:响应时间是两部分之和:服务时间和排队时间。服务时间是指数据库处理这个查询真正花多长时间。排队时间是指服务器因为等待某些资源而没有真正执行查询的时间--可能是等IO操作完成,也可能
是等待行锁等等。
b. 扫描的行数和返回的行数:分析查询时,查看该查询扫描的行数是非常有帮助的。这在一定程度上能够说明该查询找到需要的数据的效率高不高。
c. 扫描的行数和访问类型:在评估查询开销的时候,需要考虑一下从表中找到某一行数据的成本。MySQL有好几种访问方式可以查询并返回一行结果。有些方式可能需要扫描很多行才能返回一行结果,也有些访问
方式可能无需扫描就能返回结果。
在EXPALIN语句中的type列反应了访问类型。访问类型有很多种,从全表扫描到索引扫描、范围扫描、唯一索引扫描、常数引用等。这里列的这些,速度是从慢到快,扫描的行数是从多到少。你不要记住这
些访问类型,但需要明白扫描表、扫描索引、范围访问和单值访问的概念。
2). 一般MySQL能使用如下三种方式应用WHERE条件,从好到坏依次为:
a. 在索引中使用WHERE条件来过滤不匹配的记录。这是在存储引擎层完成的。
b. 使用索引覆盖扫描(在Extra列中出现Using index)来返回记录,直接从索引中过滤不需要的记录并返回命中的结果。这是在MySQL服务器层完成的,但无需再回表查询记录。
c. 从数据表中返回数据,然后过滤掉不满足条件的记录(在Extra列中出现Using Where)。这在MySQL服务器层完成,MySQL需要先从数据表读取记录然后过滤。
3). 如果发现查询需要扫描大量的数据但只返回少数的行(使用聚合函数等),那么通常可以尝试下面的技巧去优化它们:
a. 使用索引覆盖扫描,把所有需要用的列都放到索引中,这样存储引擎无需回表获取对应行就可以返回结果了。
b. 改变库表结构。例如使用单独的汇总表。
c. 重写这个复杂的查询,让MySQL优化器能够以更优的方式执行这个查询。
3. 重构查询的方式:有时候,可以将查询转换一种写法让其返回一样的结果,但性能更好。
3.1 一个复杂查询还是多个简单查询
a. 设计查询的时候一个需要考虑的重要问题是,是否需要将一个复杂的查询分成过个简单的查询。在传统实现中,总是强调需要数据库层完成尽可能多的工作,这样做的逻辑在于以前总是认为网络通信、
查询解析和优化是一件代价很高的事情。但是这样的想法对于MySQL并不适用,MySQL从设计上让连接和断开连接都很轻量级,在返回一个小的查询结果方面很高效。现代的网络速度比以前要快的多,
无论是带宽还是延迟。
b. MySQL内部每秒能够扫描内存中上百万行数据,相比之下,MySQL响应数据给客户端就慢得多了。在其他条件都相同的时候,使用尽可能少的查询当然是更好的。但是有时候,将一个大查询分解成
多个小查询也是很有必要的。
3.2 切分查询:删除旧数据是一个很好的例子。定期清除大量数据时,乳沟用一个大的语句一次性删除完成的话,则可能需要一次锁住很多数据、占满整个事务日志、耗尽系统资源、阻塞很多小的但很重要的查询。
同时需要注意,如果每次删除数据后,都暂停一会再做下一次删除,可以经服务器压力分散到很长的时间段中。
3.3 分解关联查询:
分解关联查询的方式重构查询有如下的优势:
a. 让缓存的效率更高。许多应用程序可以方便地使用缓存单表查询对应的结果集。
b. 将查询分解后,执行单个查询可以减少锁的竞争。
c. 在应用层做关联,可以更容易对数据库进行拆分,更容易做到高性能和可扩展性。
d. 查询本身效率也可能会有所提升。
e. 可以减少冗余记录的查询。管理查询中可能需要重复地访问一部分数据。
f. 更进一步,这样做相当于在应用中实现了哈希关联,而不是使用MySQL的嵌套循环关联。某些场景哈希关联的效率要高很多。
4. 查询执行的基础:
查询执行的过程:
1). 客户单发送一条查询给服务器
2). 服务器检查查询缓存,如果命中了缓存,则立刻返回存储在缓存中的结果。否则进入下一阶段。
3). 服务器端进行SQL解析、预处理,再由优化器生成对应的执行计划。
4). MySQL根据优化器生成的执行计划,调用存储引擎的API来执行查询。
5). 将结果返回给客户端。
标签:
原文地址:http://www.cnblogs.com/Jtianlin/p/5154456.html