【数据结构】——哈夫曼树

c

速通回忆

这里是完整的代码和运行结果,可以直接选择看下面代码的思路去快速回忆哈夫曼树,或从下面理论部分开始学习

#include "stdio.h"
#include "stdlib.h"

/* 哈夫曼树结点的结构体 */
typedef struct {
    int weight; /* 权重 */
    int parent; /* 父母结点下标 */
    int lchild; /* 左孩子结点下标 */
    int rchild; /* 右孩子结点下标 */
} node;

/* 树结构体 */
typedef struct {
    node *htnode;
    int length;
} HFTree;

/* 哈夫曼树初始化 */
HFTree *Init_HuffmanTree(int *num, int num_length) {
    /* 分配动态内存 */
    HFTree *tree_temp = (HFTree *)malloc(sizeof(HFTree));
    tree_temp->htnode = (node *)malloc(sizeof(node) * (2 * num_length - 1));
    tree_temp->length = num_length;

    /* 初始化每个结点结构体的内容 */
    for (int i = 0; i < 2 * num_length - 1; i++) {
        if (i < num_length) {
            tree_temp->htnode[i].weight = num[i];
        } else {
            tree_temp->htnode[i].weight = 0;
        }
        tree_temp->htnode[i].parent = -1;
        tree_temp->htnode[i].lchild = -1;
        tree_temp->htnode[i].rchild = -1;
    }
    return tree_temp;
}

/* 哈夫曼树提取最小的两位数 */
void GetMinSecond(HFTree *hftree, int *min1, int *min2) {
    *min1 = -1;
    *min2 = -1;

    /* 找到两个最小的节点 */
    for (int i = 0; i < hftree->length; i++) {
        if (hftree->htnode[i].parent != -1) continue; // 跳过已经有父节点的节点

        if (*min1 == -1 || hftree->htnode[i].weight < hftree->htnode[*min1].weight) {
            *min2 = *min1;
            *min1 = i;
        } else if (*min2 == -1 || hftree->htnode[i].weight < hftree->htnode[*min2].weight) {
            *min2 = i;
        }
    }
}

/* 构建哈夫曼树 */
void Create_HFTree(HFTree *hftree) {
    int tree_length = 2 * hftree->length - 1;
    int min1, min2;

    /* 填充父母结点 */
    for (int i = hftree->length; i < tree_length; i++) {
        GetMinSecond(hftree, &min1, &min2);

        /* 父母结点的值为左右孩子结点的权重和 */
        hftree->htnode[i].weight = hftree->htnode[min1].weight + hftree->htnode[min2].weight;
        hftree->htnode[i].lchild = min1;
        hftree->htnode[i].rchild = min2;

        /* 左右孩子的父母结点都为i */
        hftree->htnode[min1].parent = i;
        hftree->htnode[min2].parent = i;

        /* 更新树的长度 */
        hftree->length++;
    }
}

/* 遍历 */
void Show_HFTree(HFTree *hftree, int index) {
    if (index != -1) {
        printf("%d  ", hftree->htnode[index].weight);
        Show_HFTree(hftree, hftree->htnode[index].lchild);
        Show_HFTree(hftree, hftree->htnode[index].rchild);
    }
}

int main() {
    int num_temp[5] = {1, 2, 3, 4, 5};
    HFTree *hftree = Init_HuffmanTree(num_temp, 5);

    Create_HFTree(hftree);
    printf("哈夫曼树的节点权重(前序遍历):\n");
    Show_HFTree(hftree, hftree->length - 1); // 从根节点开始遍历
    printf("\n");
    return 0;
}

认识哈夫曼树

哈夫曼树(Huffman Tree),又名:最优二叉树|
给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近

  • 路径:在一棵树中,一个结点到另一个结点之间的通路,称为路径

  • 路径长度:在一条路径中,每经过一个结点,路径长度都要加 1

  • 结点的权:给每一个结点赋予一个新的数值

  • 结点的带权路径长度:指的是从根结点到该结点之间的路径长度与该结点的权的乘积

  • 树的带权路径长度为树中所有叶子结点的带权路径长度之和。通常记作 “WPL”

构建哈夫曼树(理论)

构建过程中,只需要遵循一个原则,那就是权重越大的结点距离树根越近

首先,选出我们数据中最小的两个数据,构建成二叉树的左孩子和右孩子,而根的数据为两者之和

其次,将刚才合成的数据作为孩子结点,其兄弟结点从未处理的数据中选出最小的一个,与当前合成结点比较,他们的根同样为左右孩子的权值和

这颗哈夫曼树的WPL值为:7*2 + 6*2 + 9 * 2 + 3 * 3 + 2 * 3

哈夫曼树的结点结构

//哈夫曼树结点结构
typedef struct {
    int weight; //结点权重
    int parent, left, right;    //父结点、左孩子、右孩子在数组中的位置下标
} HTNode, *HuffmanTree;

构建哈夫曼树

//HT为地址传递的存储哈夫曼树的数组,w为存储结点权重值的数组,n为结点个数
void CreateHuffmanTree(HuffmanTree *HT, int *w, int n) {
    if(n <= 1)
        return; // 如果只有一个编码就相当于0
    int m = 2*n-1; // 哈夫曼树总节点数,n就是叶子结点
    *HT = (HuffmanTree)malloc((m+1) * sizeof(HTNode)); // 0号位置不用
    HuffmanTree p = *HT;
// 初始化哈夫曼树中的所有结点
    for(int i = 1; i <= n; i++) {
        (p+i)->weight = *(w+i-1);
        (p+i)->parent = 0;
        (p+i)->left = 0;
        (p+i)->right = 0;
    }
//从树组的下标 n+1 开始初始化哈夫曼树中除叶子结点外的结点
    for(int i = n+1; i <= m; i++) {
        (p+i)->weight = 0;
        (p+i)->parent = 0;
        (p+i)->left = 0;
        (p+i)->right = 0;
    }
//构建哈夫曼树
    for(int i = n+1; i <= m; i++) {
        int s1, s2;
        Select(*HT, i-1, &s1, &s2);    //查找内容,需要用到查找算法
        (*HT)[s1].parent = (*HT)[s2].parent = i;
        (*HT)[i].left = s1;
        (*HT)[i].right = s2;
        (*HT)[i].weight = (*HT)[s1].weight + (*HT)[s2].weight;
    }
}

哈夫曼树查找算法

//HT数组中存放的哈夫曼树,end表示HT数组中存放结点的最终位置,s1和s2传递的是HT数组中权重值最小的两个结点在数组中的位置
void Select(HuffmanTree HT, int end, int *s1, int *s2) {
    int min1, min2;
//遍历数组初始下标为 1
    int i = 1;
//找到还没构建树的结点
    while(HT[i].parent != 0 && i <= end) {
        i++;
    }
    min1 = HT[i].weight;
    *s1 = i;
    i++;
    while(HT[i].parent != 0 && i <= end) {
        i++;
    }
//对找到的两个结点比较大小,min2为大的,min1为小的
    if(HT[i].weight < min1) {
        min2 = min1;
        *s2 = *s1;
        min1 = HT[i].weight;
        *s1 = i;
    } else {
        min2 = HT[i].weight;
        *s2 = i;
    }
//两个结点和后续的所有未构建成树的结点做比较
    for(int j=i+1; j <= end; j++) {
//如果有父结点,直接跳过,进行下一个
        if(HT[j].parent != 0) {
            continue;
        }
//如果比最小的还小,将min2=min1,min1赋值新的结点的下标
        if(HT[j].weight < min1) {
            min2 = min1;
            min1 = HT[j].weight;
            *s2 = *s1;
            *s1 = j;
        }
//如果介于两者之间,min2赋值为新的结点的位置下标
        else if(HT[j].weight >= min1 && HT[j].weight < min2) {
            min2 = HT[j].weight;
            *s2 = j;
        }
    }
}

相关文章

强化C【C语言笔记】——位运算

位运算符C语言提供了六种位运算符 - &:按位与 - !:按位或 - ^:异或 - ~:取反 - <<:左移 - \>>:右移 按位与运算 **其功能是参与运算的两数各对应的二进位相与。只有对应的两个二进位均为1时,结果位才为1,否则为0** 按位与运算通常用来对某些位清0 按位或运算 **其功能是参与运算的两数各对应的二进位相或。只要对应的二个二进位有一个为1时,结果位就...

c

C语言中规中矩的大树

**没事干,写个树玩玩,真正的“撸树”** 在Ubuntu终端、VScode终端显示 代码 ``` #include "stdio.h" int main(){ int high = 5; //层高 int count = 5; //层数 int start; //每层开始*数 int...

c

细说C语言【内存存储】

**本文章分为:内存结构、大小端存储、不同数据类型的存储方式** 内存结构 C语言中,对内存进行了划分。总共分为:栈区、堆区、代码区、常量区、全局数据区。 其中全局数据又可细分为:初始化静态数据区和未初始化静态数据区 栈区 - **存放函数执行时的局部变量、函数参数和函数返回值** - 栈区的**大小由操作系统决定** - 函数之间的调用是通过栈实现的,**调用函数就入栈,函...

c