mysql索引原理及优化-技术圈

点击上方蓝色字体，选择“标星公众号”

优质文章，第一时间送达

作者 | Nooooone

来源 | urlify.cn/NB3Yrq

mysql索引使用B+tree，为什么使用B+tree呢，首先，使用索引是为了加快查找的速度，B+tree的查找时间复杂度为log(n).那为什么不用o(1)的hashMap呢。mysql是有使用hashMap结构的hash索引的，但大部分情况下，我们使用的索引并不是hash索引，主要是hash索引这种结果在处理 !=, > ，< 这种范围查询时，需要全表扫描，时间复杂度为o(n).
为什么不使用B tree？BTree和B+Tree的区别是，B+Tree的非叶子结点只保存索引，不保存数据，这样一个节点保存的数据更多，树的高度更低，在读取索引时，可以省IO(其实，这里降低树高度基本没啥用，因为往往我们的Tree的每个节点的度都很大，BTree和B+Tree高度基本差不多)。另一个主要的作用是，由于数据节点都在叶子结点上，而每个叶子结点又使用双向链表链接，这样，在处理范围查询时，只需要查定一个下界，然后在叶子结点上遍历即可，且天然有序。

以Innodb为例：主键索引是和数据文件放在一块的，即数据文件在叶子结点上。对于主键索引，找到了主键索引，主键索引对应的value即为数据row。而非主键索引被称为二级索引的原因是，非主键索引的value存放的是主键的值，我们在使用非主键索引查找时，需要先根据索引找到主键，然后根据主键去找数据row。根据主键再去找数据row的过程称为回表。因为对于这样的索引，不直接和数据关联，所以称为二级索引。对于二级索引，如果我们查找的列，已经全部在索引列里了，这时候就不需要回表了，这种索引成为覆盖(covered)索引.
主键索引也叫聚簇索引，二级索引也叫非聚簇索引

use index：仅需要使用索引，不需要回表。
use where：通过where子句过滤，where子句过滤存储引擎返回的结果。
use filesort 需要使用排序
const：用主键匹配
eq_ref: 两个表join的时候，join的key是两个表的主键。这时候，对于前一个表的每一行，后一张表只需要扫描一行 One row is read from this table for each combination of rows from the previous tables. Other than the system and const types, this is the best possible join type. It is used when all parts of an index are used by the join and the index is a PRIMARY KEY or UNIQUE NOT NULL index.
ref: 通过非唯一索引扫描，通常不需要进行排序时，只要通过ref或者最左前缀匹配就可以了
range: range can be used when a key column is compared to a constant using any of the =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, LIKE, or IN() operators.
index：使用索引，但比如在扫描之后还需要order by. 这时候，需要扫描整个索引树。
all：全表扫。
通常情况下，我们优化的目标到ref就可以了
当我们想对一个sql语句进行优化时，可以用explain查看当前sql的执行计划。对于explain的输出，几个重要的如下。
Type：
extra：

对于联合索引，比如(row1,row2,row3)这种，mysql按照最左前缀匹配的时候，相当于给我们建了(row1),(row1,row2),(row1,row2,row3)三个索引。因此当有联合索引的时候，不再需要单独建立额外的单列索引。
数据查询时，where自己后面的顺序无所谓，mysql会自动帮你优化。
where 后面在使用or 查询的时候，大部分情况下不会走到索引。所以，对于这种查询，可以使用union来优化In many cases, MySQL won't be able to use an index to apply an OR condition, and as a result, this query is not index-able.Therefore, we recommend to avoid such OR conditions and consider splitting the query to two parts, combined with a UNION DISTINCT (or even better, UNION ALL, in case you know there won't be any duplicate results）
建索引时，范围字段放在联合索引的最后，因为按照最左前缀匹配原则，碰到范围字段就终止匹配了，后面的字段不会去匹配。
区分度大的字段在建索引时放在前面。区分度公式：count(distinct col)/count(*)，就是一个字段当选择了一个值时，要能过滤掉大部分字段。

NULL is not data type
NULL is a value place holder for optional table fields.
MySQL treats the NULL value differently from other data types. The NULL values when used in a condition evaluates to the false Boolean value.
Performing arithmetic operations on NULL values always returns NULL results.
The comparison operators such as [, =, etc.] cannot be used to compare NULL values.
‘+ - * / = != ’这些操作在作用于NULL时，永远返回NULL，在返回NULL做条件判断时返回false。
对于NULL的判断，使用is NULL 和is not NULL来判断，使用= ， !=,都不会得到你想要的结果。
建表时，尽量所有字段都设置为非NULL，设为NULL时，mysql还需要额外使用字段来标记是否为NULL。