Table of Contents generated with DocToc
- 树(Tree)
树(Tree)是n(n>=0)个结点的有限集。n=0时称为空树。
在任意一棵非空树中:
(1)有且仅有一个特定的称为根(root)的结点。
(2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1,T2,....,Tm, 其中每一个集合本身又是一棵树,并且称为根的子树(SubTree)
- 结点:树中的一个独立单元。包含一个数据元素及若干指向其子树的分支
- 结点的度(Degree):结点拥有的子树。度为0的结点称为叶结点(Leaf)或终端结点;度不为0的结点称为非终端结点或分支结点。例如,A的度为3,C的度为0,F的度为0。
- 阶(order): 在树中,一个节点可以拥有的最大子树数量称为阶。
- 树的度: 是树内各结点的度的最大值。
- 结点的层次(Level):从根开始定义起,根为第一层,根的孩子为第二层。其双亲在同一层的结点互为堂兄弟。
- 非终端结点:度不为0的结点称为非终端结点或分支结点。
- 双亲和孩子:结点的子树的根称为该结点的孩子,相应地,该结点称为孩子的双亲
- 树的阶数:描述树中每个节点所拥有的子节点的最大数量。例如B树。在B树中,’m阶’意味着每个节点最多可以包含m个子节点。
- 结点数=总度数+1
- 度为m的树或m叉树,第i层至多有m^(i-1)个结点(i>=1)
- 高度为h的m叉树至多有m^h-1/m-1个结点
有五种基本形态
少了些叶子结点时,具有的编号都能和满二叉树一一对应上。
- 左子树所有的关键字小于根结点的关键字
- 右子树所有的关键字大于根节点的关键字
- 左子树和右子树又各是一个二叉排序树
指对树中所有结点信息的访问,即依次对树中每个结点的访问一次且仅访问一次。
借助队列1,自己出队时放到队列2,接着把左右子元素入队列1。
栈的方式实现中序遍历:递归的时候隐式地维护了一个栈,而我们在迭代的时候需要显式地将这个栈模拟出来,其他都相同
- 前序遍历: [ 根节点, [左子树的前序遍历结果], [右子树的前序遍历结果] ]
- 中序遍历: [ [左子树的中序遍历结果], 根节点, [右子树的中序遍历结果] ]
所以 1 为根节点
- 1 的左边: 7,4,2,5 对应preorder 2,4,7,5
- 1 的右边: 6,3 对应preorder 3,6
接下来根据 2 构造根节点
- 2 的左边: 7,4 对应preorder 4,7
- 2 的右边: 5 对应preorder 5
对一棵二叉树中所有节点的空指针域按照某种遍历方式加线索的过程叫作线索化,被线索化了的二叉树称为线索二叉树。
知道了“前驱”和“后继”信息,就可以把二叉树看作一个链表结构,从而可以像遍历链表那样来遍历二叉树,进而提高效率
标识域:
- 如果ltag=0,表示指向节点的左孩子。如果ltag=1,则表示lchild为线索,指向节点的直接前驱
- 如果rtag=0,表示指向节点的右孩子。如果rtag=1,则表示rchild为线索,指向节点的直接后继
二叉查找树(Binary Search Tree),也称二叉搜索树。
- 若任意节点的左子树不空,则左子树上所有节点的值均小于它的根节点的值;
- 若任意节点的右子树不空,则右子树上所有节点的值均大于它的根节点的值;
- 任意节点的左、右子树也分别为二叉查找树;
- 没有键值相等的节点
查找成功 的平均查找长度(ASL average search length)
查找失败 的平均查找长度(ASL average search length)
平衡因子(BF,Balance Factor): 某节点的左子树与右子树的高度(深度)差,
平衡二叉树中不存在平衡因子大于 1 的节点。 在一棵平衡二叉树中,节点的平衡因子只能取 0 、1 或者 -1 ,分别对应着左右子树等高,左子树比较高,右子树比较高。
二叉搜索树的查找效率取决于树的高度,因此保持树的高度最小,即可保证树的查找效率。
插入的是68 导致不平衡。
最小失衡子树:在新插入的结点向上查找,以第一个平衡因子的绝对值超过 1 的结点为根的子树称为最小不平衡子树。也就是说,一棵失衡的树,是有可能有多棵子树同时失衡的。而这个时候,我们只要调整最小的不平衡子树,就能够将不平衡的树调整为平衡的树。
调整方式:平衡二叉树的失衡调整主要是通过旋转最小失衡子树来实现的,根据旋转的方向有两种处理方式,左旋 与 右旋。旋转的目的就是减少高度,通过降低整棵树的高度来平衡。哪边的树高,就把那边的树向上旋转。
右旋:针对左边高
- (1)节点的左孩子代表此节点
- (2)节点的左孩子的右子树变为节点的左子树
- (3)将此节点作为左孩子节点的右子树。
左旋:针对右边高
- (1)节点的右孩子替代此节点位置
- (2)右孩子的左子树变为该节点的右子树
- (3)节点本身变为右孩子的左子树
插入的是68,如70是最小失衡子树,调整最小不平衡子树
- 左左更高
向右旋转,然后30放在右侧左子树
- 左右更高
向左旋转, 向右旋转
在通信上广泛应用
- 浪费空间
- 人物长度固定
- 长度不固定
- 长度短
B-树,就是B树,B树的原英文名是B-tree,所以很多翻译为B-树,就会很多人误以为B-树是一种树、B树是另外一种树。其实,B-tree就是B树
B树的基本思想是保证每个节点至少填满一半的关键字,以达到较好的性能。其优点是对于大规模数据的插入和删除操作,它仍然能够保持较好的性能,但缺点是每个节点都需要存储一定数量的指针,导致存储空间的浪费。
B树属于多叉树又名平衡多路查找树.
n个关键字--分为n+1个区间,注意线画在关键字中间
B+树在B树的基础上进行了改进,主要对两个方面进行了提升,一方面是查询的稳定性,另外一方面是在数据排序方面更友好。
(1)B+树的非叶子节点不保存具体的数据,而只保存关键字的索引,而所有的数据最终都会保存到叶子节点。因为所有数据必须要到叶子节点才能获取到,所以每次数据查询的次数都一样,这样一来B+树的查询速度也就会比较稳定,而B树的查找过程中,不同的关键字查找的次数很有可能都是不同的(有的数据可能在根节点,有的数据可能在最下层的叶节点),所以在数据库的应用层面,B+树就显得更合适。
(2)B+树叶子节点的关键字从小到大有序排列,左边结尾数据都会保存右边节点开始数据的指针。因为叶子节点都是有序排列的,所以B+树对于数据的排序有着更好的支持。
- 查找:可以从根节点通过分块查找,也可以通过叶节点采用顺序查找
- 索引是是子树最大值,线连在子树中间