之前在网上看到过一些B树与B+树的区别然后主要是针对定义来陈述,分分钟看的我快要冬眠,然后在一次面试遇到该没问题没回答上来一首凉凉送 给自己,今天老老实实的分享自己对B树,B+树浅显理解,若望指出不足。

B树的原理

动态查找树主要包括:二叉搜索树,平衡二叉树,红黑树,B树,B-树时间复杂度O(log2N),通过对树高度的降低可以提升查找效率

尤其是在大量数据进行存储的时候会存储到外部 磁盘,通过对外部磁盘的读取时需要快速的查找到对应的位置,所以需要一种高效的外村数据结构。

B树:就是为了存储设备或者磁盘设计的一种平衡查找树

辨析1:B树与红黑树的区别

B树的节点可以有很多孩子节点,红黑树是一种近似平衡的二叉搜索树即每个节点只有两个孩子

一颗含有N个节点的B树和红黑树的高度是一样的O(lgn)。

B树的定义

对于一颗M阶的B树

  • 树中的每个节点最多有m个孩子
  • 除了根节点和叶子节点外,其他节点最少含有m/2(取上限)个孩子
  • 若根节点不是叶子节点,则根节点最少含有两个孩子
  • 所以叶子节点都在同一层,叶子节点不包含任何关键字信息

B树的类型与节点定义

struct BTNode
{
 int keyNum ; //实际关键字的个数
 PBTNode parent;//指向父亲节点
 PBTNode *ptr ;
 keyType *key ; //关键字向量
}

B树的插入操作

B树的插入

  • 若B树中已存在需要插入的键值时,用新的键值替换旧值;
  • 若B树中不存在这个值,则在叶子节点进行插入操作;

具体插入过程如下

对于高度为h的m阶B树,新节点一般插在第h层。

  • 若该节点中关键码个数小于m-1,则直接插入
  • 若该节点中关键码个数等于m-1,则节点分裂。以中间的关键码为界,

将节点一分为二,产生一个新的节点,并将中间关键码插入到父节点中。

重复上述过程,最坏情况一直分裂高根节点,则B树就会增加一层。

B+树的插入操作

B+树插入

1.若为空树直接插入

2.对于叶子结点: 根据key找到叶子结点,对叶子结点进行插入操作。插入后如果当前叶子结点的key值数b不大于m-1,则插入结束。

反之,将这个叶子结点分成左右两个叶子结点进行操作,左叶子结点包含前m/2个记录,右叶子结点包含剩下的记录key,将第m/2+1个记录的key进位到父结点中,(父结点必须是索引类型的结点)

进位到父结点的key,进位的key左孩子指向左结点,右孩子指向右结点。

3.对于索引结点: 如果当前结点的key个数小于等于m-1,插入结束。

反之,将这个索引类型的结点分成两个索引结点,左索引结点包含前(m-1)/2个数据,右结点包含m-(m-1)/2个数据

将第m/2个key进位到父结点中,进位的key左孩子指向左结点,右孩子指向右结点

剖析2:为什么B+树比B树更适合做系统的数据库索引和文件索引

1)B+树的磁盘读写代价更低

因为B+树内部结点没有指向关键字具体信息的指针,内部结点相对B树小

2)B+树的查询更加稳定

因为非终端结点并不是指向文件内容的结点,仅仅是作为叶子结点的关键字索引,因此所有的关键字查询都会走一条从根节点到叶子结点的路径。即s所有关键字查询的长度是一样的,查询效率稳定。

来源:blog.csdn.net/yu876876/article/details/84896789

作者:海马HiMark