MySql存储引擎和数据结构

InnoDB

我们数据库用的是哪种数据结构呢？我们先举出常用的几种数据类型进行比较

多叉树，它的非叶子节点也存数据（这里数据指的是聚簇索引中的所在行数据，非聚簇索引中的主键id，下面会讲到）

优点：

它的非叶子节点是不存储数据，只存储索引，数据都存在叶子节点上

因为存储空间有限，如果非叶子节点存储了数据，那么它的叉数就没有不存的多。叉数变多，树就会更矮

优点：

B+树的层级更少：开销小；
B+树查询速度更稳定：B+所有关键字数据地址都存在叶子节点上，所以每次查找的次数都相同所以查询速度要比B树更稳定;
B+树范围查找更快：B+树所有的叶子节点数据构成了一个有序链表，在查询大小区间的数据时候更方便。
B+树全节点遍历更快：B+树遍历整棵树只需要遍历所有的叶子节点即可，而不需要像B树一样需要对每一层进行遍历，这有利于数据库做全表扫描。（innodb存储引擎中表的数据就是存在聚簇索引中，所以全表扫描就是遍历所有的聚簇索引）

InnoDB 主键使用的是聚簇索引，MyISAM 不管是主键索引，还是二级索引使用的都是非聚簇索引

因为我们日常工作中，用的最多的是InnoDB存储引擎，所以我们着重讲一下它的数据结构

InnoDB默认的数据结构是B+树，简单的将InnoDB中每张表的存储结构其实就是多个B+树。包括一个存储着行数据的聚簇索引的B+树和其他存储着主键id的非聚簇索引构成。

在InnoDB中除主键索引外的其他索引用的是非聚簇索引
它的特点是key存的是索引值，value存的是主键索引的id
当我们sql中用到了非聚簇索引的话，会先从非聚簇索引树中找到对应的主键id，然后再从聚簇索引树中找到主键对应的行数据（会遍历两棵树，称为回表）。
回表会比较费时间，如果索引的字段覆盖了我们查询的所有字段的话，那么就不需要去进行回表查询，我们称为覆盖索引现在我创建了联合索引(username,age)，在查询数据的时候要查询出的列在非聚簇索引都存在！所以，就不用回表。

select username , age from user where username = 'Java' and age =22

联合索引经常配合覆盖索引一起使用，例如上面的例子

我们一般讲(username,age,sex)联合索引，既建了【username】，【username，age】，【username，age, sex】三个索引。

而我们发现【username，sex】也是能用到索引的，但是其实匹配到的是【username】这个索引