B-树和B+树

时间：2018-05-11 20:22:07 阅读：128 评论：0 收藏：0 [点我收藏+]

B-树就是B树。

问题一：数据库索引为什么要用树结构存储？ -------- 树查询快，并且可以保持有序

问题二：为什么索引没有用二叉查找树来实现？ --------数据库索引是存在磁盘上的，

B树是一种多路平衡查找树，它的每一个节点最多包含m个孩子，m称为B树的阶。m的大小取决于磁盘页的大小。

一个m阶的B树具有如下几个特征：

1.根结点至少有两个子女。

2.每个中间节点都包含k-1个元素和k个孩子，其中 m/2 <= k <= m

3.每一个叶子节点都包含k-1个元素，其中 m/2 <= k <= m

4.所有的叶子结点都位于同一层。

5.每个节点中的元素从小到大排列，节点当中k-1个元素正好是k个孩子包含的元素的值域分划。

技术分享图片

只要树的高度足够低，IO的次数足够少，查找性能就提高了。

应用：主要应用于文件系统以及部分数据库索引，比如非关系型数据库。

B+树是基于B树的，更好的查询性能。

一个m阶的B+树具有如下几个特征：

1.有k个子树的中间节点包含有k个元素（B树中是k-1个元素），每个元素不保存数据，只用来索引，所有数据都保存在叶子节点。

2.所有的叶子结点中包含了全部元素的信息，及指向含这些元素记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。

3.所有的中间节点元素都同时存在于子节点，在子节点元素中是最大（或最小）元素。

技术分享图片

B-树中每个节点都带有卫星数据，而B+树中只有叶子结点带有卫星数据，其余中间节点仅仅是索引，没有任何数据关联。

需要补充的是，在数据库的聚集索引中，叶子节点直接包含卫星数据。在非聚集索引中，叶子节点带有指向卫星数据的指针。

对比B-树，如何提高性能：

单行查询下：

1）B+树中间节点不带卫星数据，所以同样大小的磁盘页可以容纳更多的节点元素。也就意味着，数据量相同时，B+树更加矮胖，IO查询次数更少。

2）B+树的查询必须最终匹配到叶子结点，而B-树只要找到匹配元素即可，查询性能不稳定。

范围查找下：B+树可以通过链表指针遍历即可，查询简便。

B+树的特征：

1.有k个子树的中间节点包含有k个元素（B树中是k-1个元素），每个元素不保存数据，只用来索引，所有数据都保存在叶子节点。

2.所有的叶子结点中包含了全部元素的信息，及指向含这些元素记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。

3.所有的中间节点元素都同时存在于子节点，在子节点元素中是最大（或最小）元素。

B+树的优势：

1.单一节点存储更多的元素，使得查询的IO次数更少。

2.所有查询都要查找到叶子节点，查询性能稳定。

3.所有叶子节点形成有序链表，便于范围查询。

原文地址：https://www.cnblogs.com/mcahkf/p/9025371.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行