标签:
树(tree)是n(
n≥0 )个结点的有限集。n=0时称为空树。在任意一棵非空树中:(1)有且仅有一个特定的称为根(Root)的结点;(2)当n>1 时,其与结点可分为m(m>0 )个互不相交的有限集T1,T2,...,Tm ,其中每个集合本身又是一棵树,并且称为根的子树(SubTree)。
结点拥有的子树数称为结点的度(Degree)。度为0的结点称为叶结点(Leaf)或终端结点。除根结点外,分支结点也称为内部结点。树的度是树内各结点的度的最大值。
结点的子树的根称为该结点的孩子(Child),相应地,该结点成为孩子的双亲(Parent)。同一个双亲的孩子之间互称兄弟(Sibling)。结点的祖先是从根到该结点所经分支上的所有结点,反之,以某结点为根的子树的任一结点都称为该结点的子孙。
结点的层次(Level)从根开始定义起,根为第一层,根的孩子为第二层。双亲在同一层的结点互称为堂兄弟。树中结点的最大层次成为树的深度(Depth)或高度。
若树中结点的各子树堪称从左导游是有次序的,不能互换的,则称该树为有序树,否则称为无序树。
森林(Forest)是m(
m≥0 )棵互不相交的树的集合。
下面比较线性结构和树结构,具体如下:
线性结构 | 树结构 |
---|---|
第一个数据元素:无前驱 | 根结点:无双亲,唯一 |
最后一个数据元素:无后继 | 叶结点:无孩子,可以多个 |
中间元素:一个前驱,一个后继 | 中间结点:一个双亲,多个孩子 |
一对一的关系 | 一对多的关系 |
相比于线性结构,数的操作大不相同,下面给出一些基本和常用操作:
ADT 树(Tree)
Data
树是由一个根结点和若干子树构成。树中节点具有相同数据类型及层次关系。
Operation
InitTree(*T):构造空树T。
DestoryTree(*T):销毁树T。
CreateTree(*T,definition):按definition中给出树的定义来构造树。
ClearTree(*T):若树T存在,则将树T清为空树。
TreeEmpty(T):若树T为空树,返回true,否则返回false。
TreeDepth(T):返回T的深度。
Root(T):返回T的根结点。
Value(T,cur_e):cur_e是树T中的一个结点,返回此结点的值。
Assign(T,cur_e,value):给树T的结点cur_e赋值为value。
Parent(T,cur_e):若cur_e是树T的非根节点,则返回它的双亲,否则返回空。
LeftChild(T,cur_e):若cur_e是树T的非叶结点,则返回它的最左孩子,否则返回空。
RightSibling(T,cur_e):若cur_e有右兄弟,返回它的右兄弟,否则返回空。
InsertChild(*T,*p,i,c):其中p指向树T的某个结点,i为所指结点p的度加上1,非空树c与T不相交,操作结果为插入c为树T中p指结点的第i棵子树。
DeleteChild(*T,*p,i):其中p指向树T的某个结点,i为所指结点p的度,操作结果为删除T中p所指结点的第i棵子树。
先说顺序存储结构,用一端地址连续的存储单元依次存储线性表的数据元素,对于线性表来说很自然,但是针对树这样一对多的结构呢?树种某个结点的孩子可以有多个,这就是无论按何种顺序将树中所有节点存储到数组中,结点的存储位置都无法直接反映逻辑关系,简单的顺序存储结构是不能满足树的实现要求的。
不过可以充分利用顺序存储和链式存储结构特点,完全可以实现对树的存储结构的表示。下面介绍三种不同的表示法:双亲表示法、孩子表示法、孩子兄弟表示法。
假设以一组连续空间存储树的结点,同时在每个结点中,附设一个指示器指示其双亲结点在数组中的位置。也就是说,每个结点除了存储自身信息外,还指示了双亲的位置。其中data是数据域,存储结点数据信息,而parent是指针域,存储该结点的双亲在数组中的下标。下面,结点结构定义代码如下:
/*树的双亲表示法结点结构定义*/
#define MAX_TREE_SIZE 100
typedef int TElemType; //树结点的数据类型,暂定为整型
typedef struct PTNode{ //结点结构
TElemType data; //结点数据
int parent; //双亲位置
}PTNode;
typedef struct{ //树结构
PTNode nodes[MAX_TREE_SIZE]; //结点数组
int r,n; //根的位置和结点数
}PTree;
根结点没有双亲,所以约定根结点的位置域设置为-1,其他结点都存有双亲位置。可以根据结点的parent指针方便地找到其双亲结点,时间复杂度为
这样很麻烦,改进一下,增加一个结点最左边孩子的域,也叫长子域,这样就很方便找到结点的孩子,若没有孩子的结点,长子域设置为-1。
当然,也很关注各兄弟间的关系,可以增加一个右兄弟域来体现兄弟关系,若结点存在右兄弟,则记录右兄弟下标,否则赋值为-1。
存储结构的设计是一个非常灵活的过程。一个存储结构设计得是否合理,取决于基于该存储结构的运算是否合适、是否方便,时间复杂度好不好等。
每个结点有多个指针域,其中每个指针指向一棵子树的根结点,我们把这种方法叫做多重链表表示法。
孩子表示法:把每个结点的孩子结点排列起来,以单链表作存储结构,则n个结点有n个孩子链表,如果是叶子结点则此单链表为空。然后n个头指针又组成一个线性表,采用顺序存储结构,存放进一个一维数组中。
孩子链表的孩子结点中child是数据域,用于存储某个节点在表头数组中下标。next是指针域,用于存储指向某结点的下一个孩子结点的指针。
表头数组的表头结点,其中data是数据域,存储某结点的数据信息。firstchild是头指针域,存储该结点的孩子链表的头指针。
以下面的树为例,其孩子表示法如下:
孩子表示法的结构定义代码:
/*树的孩子表示法结构定义*/
#define MAX_TREE_SIZE 100
typedef struct CTNode{ //孩子结点
int child;
struct CTNode *next;
}*ChildPtr;
typedef struct{ //表头结构
TElemType data;
ChildPtr firstchild;
}CTBox;
typedef struct{ //树结构
CTBox nodes[MAX_TREE_SIZE]; //结点数组
int r,n; //根位置和结点数
}CTree;
这样的结构无论是查找某个结点的某个孩子或查找某个结点的兄弟,只需要查找这个结点的孩子单链表即可,对于遍历整棵树也是很方便的,对头结点的数组循环即可。但是也存在问题,结点的双亲查找比较麻烦,可以将双亲表示法和孩子表示法综合。如下图所示,双亲孩子表示法:
任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。因此,我们设置两个指针,分别指向该结点的第一个孩子和此结点的右兄弟。
结构定义如下:
/*树的孩子兄弟表示法结构定义*/
typedef struct CSNode{
TElemType data; //数据域
//firstchild为指针域,存储该结点的第一个孩子结点的存储地址,rightchild为指针域,存储该结点的右兄弟结点的存储地址。
struct CSNode *firstchild,*rightchild;
}CSNode,*CSTree;
小结:这种表示法,查找某个结点的某个孩子可以通过firstchild找到此结点的长子,再通过长子结点的rightsib找到其二弟,接着一直下去,直到找到具体的孩子,这个表示法最大的好处就是将一棵复杂的树变成一棵二叉树。当然,若想找某结点的双亲,这个表示也有缺陷。当然,完全可以再增加一个parent指针域来解决快速查找双亲的问题。
标签:
原文地址:http://blog.csdn.net/dengpei187/article/details/51887004