> 文章列表 > C++——一种特殊的二叉搜索树之AVL树

C++——一种特殊的二叉搜索树之AVL树

C++——一种特殊的二叉搜索树之AVL树

目录

  • 序言
  • 1 AVL树的概念
  • 2 AVL树节点的定义
  • 3 AVL树的插入
    • 是否继续更新依据:子树的高度是否变化
  • 4 AVL树的旋转
    • 旋转的原则:
      • 1. 新节点插入较高左子树的左侧---左左:右单旋
      • 2. 新节点插入较高右子树的右侧---右右:左单旋
      • 3. 新节点插入较高左子树的右侧---左右:先左单旋再右单旋
      • 4. 新节点插入较高右子树的左侧---右左:先右单旋再左单旋
  • 5.如何验证一颗树是AVL树的验证?
  • 6 AVL树的删除(了解)
  • 7 AVL树的性能

接——map和set的应用总结

序言

前面对map/multimap/set/multiset进行了简单的介绍,在其文档介绍中发现,这几个容器有个共同点是:其底层都是按照二叉搜索树来实现的,但是二叉搜索树有其自身的缺陷,假如往树中插入的元素有序或者接近有序,二叉搜索树就会退化成单支树,时间复杂度会退化成O(N),因此map、set等关联式容器的底层结构是对二叉树进行了平衡处理,即采用平衡树来实现。

1 AVL树的概念

二叉搜索树虽可以缩短查找的效率,但如果数据有序或接近有序二叉搜索树将退化为单支树,查找元素相当于在顺序表中搜索元素,效率低下。因此,两位俄罗斯的数学家G.M.Adelson-Velskii和E.M.Landis在1962年发明了一种解决上述问题的方法:当向二叉搜索树中插入新结点后,如果能保证每个结点的左右子树高度之差的绝对值不超过1(需要对树中的结点进行调整),即可降低树的高度,从而减少平均搜索长度。

一棵AVL树或者是空树,或者是具有以下性质的二叉搜索树:

  • 它的左右子树都是AVL树
  • 左右子树高度之差(简称平衡因子)的绝对值不超过1(-1/0/1)
    C++——一种特殊的二叉搜索树之AVL树
    如果一棵二叉搜索树是高度平衡的,它就是AVL树。如果它有n个结点,其高度可保持在O(log2n)O(log_2 n)O(log2n),搜索时间复杂度O(log2nlog_2 nlog2n)。

2 AVL树节点的定义

AVL树节点的定义:
平衡因子(_bf)=右子树的高度-左子树的高度

struct AVLTreeNode
{pair<K, V> _kv;//键值对AVLTreeNode<K, V>* _left;AVLTreeNode<K, V>* _right;AVLTreeNode<K, V>* _parent;int _bf;  // 平衡因子 balance factor=右子树的高度-左子树的高度AVLTreeNode(const pair<K, V>& kv):_kv(kv), _left(nullptr), _right(nullptr), _parent(nullptr), _bf(0){}
};

3 AVL树的插入

AVL树就是在二叉搜索树的基础上引入了平衡因子,因此AVL树也可以看成是二叉搜索树。
那么AVL树的插入过程可以分为两步:

  1. 按照二叉搜索树的方式插入新节点
  2. 调整节点的平衡因子

是否继续更新依据:子树的高度是否变化

下面拿一个右单旋的图来说明一下parent、subL、subLR三者之间的关系,让读者更能理解这里向上更新平衡因子的逻辑。
C++——一种特殊的二叉搜索树之AVL树

更新之后如果:(_bf为该节点的平衡因子,平衡因子=右子树的高度-左子树的高度

  • parent->_bf == 0,那么之前parent->_bf是 1 或者 -1。
    说明之前parent一边高一边低,这次插入填上矮的那边,parent所在子树整体高度不变,对于parent的双亲结点没有影响,不需要继续往上更新。

  • parent->_bf == 1 或 -1,之前是parent->_bf == 0。
    说明插入前两边一样高,现在插入一边更高了,parent所在子树高度变了,继续往上更新。

  • parent->_bf == 2 或 -2,之前parent->_bf == 1 或者 -1。
    现在插入一个新节点后严重不平衡,违反规则需要就地处理——旋转,如何旋转?下面会有介绍。

AVL树的插入代码整体框架:

bool Insert(const pair<K, V>& kv)
{if (_root == nullptr)//如果当前是空树{_root = new Node(kv);return true;}//向下找该结点的插入位置//开始向下寻找该要被插入结点的父节点Node* parent = nullptr;Node* cur = _root;while (cur){if (cur->_kv.first < kv.first){parent = cur;cur = cur->_right;//往右走}else if (cur->_kv.first > kv.first){parent = cur;cur = cur->_left;//往左走}else{return false;//不能插入相等(重复)的值}}//找到位置然后正确的将结点插入cur = new Node(kv);if (parent->_kv.first < kv.first){parent->_right = cur;cur->_parent = parent;}else{parent->_left = cur;cur->_parent = parent;}// 1、开始向上更新 平衡因子while (parent) // parent为空,也就更新到根了{// 新增在右,parent->bf++;// 新增在左,parent->bf--;if (cur == parent->_left){parent->_bf--;}else{parent->_bf++;}//parent->_bf == 0,那么之前parent->_bf是 1 或者 -1//说明之前parent一边高一边低,这次插入填上矮的那边,parent所在子树整体高度不变,//对于parent的双亲结点没有影响,不需要继续往上更新,退出更新的循环if (parent->_bf == 0){break;}//parent->_bf == 1 或 -1,说明之前是parent->_bf == 0,两边一样高,//现在插入一边更高了,parent所在子树高度变了,继续往上更新。else if (parent->_bf == 1 || parent->_bf == -1){cur = parent;parent = parent->_parent;}// parent->_bf == 2 或 -2,说明之前parent->_bf == 1 或者 -1,// 现在插入严重不平衡,违反规则需要就地处理——旋转else if (parent->_bf == 2 || parent->_bf == -2){//左单旋if (parent->_bf == 2 && cur->_bf == 1){RotateL(parent);}//右单旋else if (parent->_bf == -2 && cur->_bf == -1){RotateR(parent);}//左右双旋else if (parent->_bf == -2 && cur->_bf == 1){RotateLR(parent);}//右左双旋else if (parent->_bf == 2 && cur->_bf == -1){RotateRL(parent);}else{assert(false);}break;}else{assert(false);}}return true;
}

4 AVL树的旋转

旋转的原则:

1、让这颗子树左右高度不超过1
2、旋转过程中继续保持是搜索树
3、更新调整节点的平衡因子
4、让这颗子树的高度跟插入前保持一致

如果在一棵原本是平衡的AVL树中插入一个新节点,可能造成不平衡,此时必须调整树的结构,使之平衡化。根据节点插入位置的不同,AVL树的旋转分为四种:

1. 新节点插入较高左子树的左侧—左左:右单旋

C++——一种特殊的二叉搜索树之AVL树
上图在插入前,AVL树是平衡的,新节点插入到30的左子树(注意:此处不是左孩子)中,30左子树增加了一层,导致以60为根的二叉树不平衡,要让60平衡,只能将60左子树的高度减少一层,右子树增加一层,即将左子树往上提,这样60转下来,因为60比30大,只能将其放在30的右子树,而如果30有右子树,右子树根的值一定大于30,小于60,只能将其放在60的左子树,旋转完成后,更新节点的平衡因子即可。

在旋转过程中,编写程序时有以下几种情况需要考虑:

  • 30节点的右孩子可能存在,也可能不存在
  • 60可能是根节点,也可能是子树。如果是根节点,旋转完成后,要更新根节点;如果是子树,可能是某个节点的左子树,也可能是右子树。

代码及注释:

void RotateR(Node* parent)
{// SubL: parent的左孩子// SubLR: parent左孩子的右孩子,注意:该结点可能为空Node* subL = parent->_left;Node* subLR = subL->_right;// 旋转完成之后,30的右孩子作为60的左孩子parent->_left = subLR;// 并且如果30的右孩子存在,因为时三叉连,需要更换其双亲结点parent为60if (subLR){subLR->_parent = parent;}// 因为60可能是棵子树,因此在更新其双亲前必须先保存60的双亲Node* ppNode = parent->_parent;// 60 作为 30的右孩子subL->_right = parent;// 更新60的双亲parent->_parent = subL;// 如果60是根节点,根新指向根节点的指针//if (_root == parent)if (ppNode == nullptr){_root = subL;_root->_parent = nullptr;}else{// 如果60是子树,可能是其双亲的左子树,也可能是右子树if (ppNode->_left == parent){ppNode->_left = subL;}else{ppNode->_right = subL;}//更新subL也就是30的双亲结点subL->_parent = ppNode;}// 根据调整后的结构更新部分节点的平衡因子,看图调整即可,右单旋都是固定的subL->_bf = parent->_bf = 0;
}

2. 新节点插入较高右子树的右侧—右右:左单旋

C++——一种特殊的二叉搜索树之AVL树

实现及情况考虑可参考右单旋,这里就不多赘述了。
参考代码:

void RotateL(Node* parent)
{Node* subR = parent->_right;Node* subRL = subR->_left;parent->_right = subRL;if (subRL)subRL->_parent = parent;Node* ppNode = parent->_parent;subR->_left = parent;parent->_parent = subR;if (ppNode == nullptr){_root = subR;_root->_parent = nullptr;}else{if (ppNode->_left == parent){ppNode->_left = subR;}else{ppNode->_right = subR;}subR->_parent = ppNode;}parent->_bf = subR->_bf = 0;
}

3. 新节点插入较高左子树的右侧—左右:先左单旋再右单旋

C++——一种特殊的二叉搜索树之AVL树

将双旋变成单旋后再旋转,即:先对30进行左单旋,然后再对90进行右单旋,旋转完成后再考虑平衡因子的更新。
判断整体的平衡因子的重要依据就是看60旋转前的平衡因子,从图中可以知道,60的左右孩子分别变成30的右孩子和90的左孩子,所以最终平衡因子的判断只需要看是

  • 在60的左边b新增(平衡因子:30->0,60->0,90->1)
  • 还是在60右边c新增(平衡因子:30->-1,60->0,90->0)
  • 60自己就是新增的结点,那么之前a、d的高度一定是0(否则插入60之前就不是一颗AVL树了)(平衡因子:30->0,60->0,90->0)
    C++——一种特殊的二叉搜索树之AVL树
void RotateLR(Node* parent)
{Node* subL = parent->_left;//30Node* subLR = subL->_right;//60//最后判断整体的平衡因子的重要依据就是看60的平衡因子,从图中可以知道,60的左右孩子分别变成,//30的有孩子和90的左孩子,所以最终平衡因子的判断只需要看在60的左边b新增,还是右边c新增即可int bf = subLR->_bf;//对30进行左旋RotateL(parent->_left);//对90进行右旋RotateR(parent);if (bf == -1) // 60左子树新增{subL->_bf = 0;parent->_bf = 1;subLR->_bf = 0;}else if (bf == 1) // 60右子树新增{parent->_bf = 0;subL->_bf = -1;subLR->_bf = 0;}else if (bf == 0) // 60自己就是新增结点{parent->_bf = 0;subL->_bf = 0;subLR->_bf = 0;}//其他情况就报断言错误else{assert(false);}
}

4. 新节点插入较高右子树的左侧—右左:先右单旋再左单旋

具体细节可参考左右双旋,先对90进行右单旋,然后再对30进行左单旋,旋转完成后再考虑平衡因子的更新。
判断整体的平衡因子的重要依据就是看60旋转前的平衡因子,从图中可以知道,60的左右孩子分别变成30的右孩子和90的左孩子,所以最终平衡因子的判断只需要看在60的左边b新增,还是右边c新增,或者说自己就是新增的结点即可。
C++——一种特殊的二叉搜索树之AVL树

代码:

void RotateRL(Node* parent)
{Node* subR = parent->_right;Node* subRL = subR->_left;int bf = subRL->_bf;RotateR(parent->_right);RotateL(parent);if (bf == 1){subR->_bf = 0;subRL->_bf = 0;parent->_bf = -1;}else if (bf == -1){subR->_bf = 1;subRL->_bf = 0;parent->_bf = 0;}else if (bf == 0){subR->_bf = 0;subRL->_bf = 0;parent->_bf = 0;}else{assert(false);}
}

总结:
假如以parent为根的子树不平衡,即parent的平衡因子为2或者-2,分以下情况考虑:

  • parent的平衡因子为2,说明parent的右子树高,设parent的右子树的根为subR
    当subR的平衡因子为1时,执行左单旋
    当subR的平衡因子为-1时,执行右左双旋
  • parent的平衡因子为-2,说明parent的左子树高,设parent的左子树的根为subL
    当subL的平衡因子为-1是,执行右单旋
    当subL的平衡因子为1时,执行左右双旋

旋转完成后,原parent为根的子树个高度降低,已经平衡,不需要再向上更新。


5.如何验证一颗树是AVL树的验证?

AVL树是在二叉搜索树的基础上加入了平衡性的限制,因此要验证AVL树,可以分两步:

  1. 验证其为二叉搜索树
    如果中序遍历可得到一个有序的序列,就说明为二叉搜索树
  2. 验证其为平衡树
  • 每个节点子树高度差的绝对值不超过1(注意节点中如果没有平衡因子)
  • 节点的平衡因子是否计算正确
void Inorder()//封装中序遍历函数,防止直接访问根节点_root
{_Inorder(_root);
}void _Inorder(Node* root)
{if (root == nullptr)return;_Inorder(root->_left);cout << root->_kv.first << ":" << root->_kv.second << endl;_Inorder(root->_right);
}int Height(Node* root)
{if (root == nullptr)return 0;int lh = Height(root->_left);int rh = Height(root->_right);return lh > rh ? lh + 1 : rh + 1;
}bool IsBalance()//封装判断平衡函数,防止直接访问根节点_root
{return IsBalance(_root);
}bool IsBalance(Node* root)
{if (root == nullptr){return true;}int leftHeight = Height(root->_left);int rightHeight = Height(root->_right);if (rightHeight - leftHeight != root->_bf){cout <<root->_kv.first<<"平衡因子异常" << endl;//和当前标识的平衡因子不符return false;}return abs(rightHeight - leftHeight) < 2//平衡因子大于等于2就不是一个AVL树了&& IsBalance(root->_left)&& IsBalance(root->_right);
}

6 AVL树的删除(了解)

因为AVL树也是二叉搜索树,可按照二叉搜索树的方式将节点删除,然后再更新平衡因子,只不过与删除不同的时,删除节点后的平衡因子更新,最差情况下一直要调整到根节点的位置。具体实现可参考《算法导论》或《数据结构-用面向对象方法与C++描述》殷人昆版。

7 AVL树的性能

AVL树是一棵绝对平衡的二叉搜索树,其要求每个节点的左右子树高度差的绝对值都不超过1,这样可以保证查询时高效的时间复杂度,即log2(N)log_2 (N)log2(N)。但是如果要对AVL树做一些结构修改的操作,性能非常低下,比如:插入时要维护其绝对平衡,通过频繁的旋转才达到这样的绝对平衡,旋转的次数比较多,更差的是在删除时,有可能一直要让旋转持续到根的位置。因此:如果需要一种查询高效且有序的数据结构,而且数据的个数为静态的(即不会改变),可以考虑AVL树,但一个结构经常修改,就不太适合。
红黑树会减少一些旋转次数,插入数据时相比AVL树就不会那么严格。

AVL树完整代码链接

推荐阅读:C++——一种特殊的二叉搜索树之红黑树