字典树Tire的一个小总结

https://blog.csdn.net/king_cannon_fodder/article/details/77175620

https://blog.csdn.net/qq_41650771/article/details/81590101

https://blog.csdn.net/u013588639/article/details/38406453

前一段时间呢学习了一下字典树，发现字典树在解决某些问题上是非常方便的（与STL中的map有些相似的地方），下面是我对字典树做的一些总结，也不算做总结，写出了自己对字典树的一些了解而已。

字典树(Trie树)，单词查找树或者前缀树，是一种用于快速检索的多叉树结构，如英文字母的字典树是一个26叉树或52叉树，数字的字典树是一个10叉树。Trie树的键由节点在树中的位置决定的，一个节点的所有子节点都有相同的前缀，根结点对应的是空字符串。

Trie树优点是最大限度地减少无谓的字符串比较，查询效率比较高。核心思想是空间换时间，利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。（以只有小写字母为例）

（1）插入、查找的时间复杂度均为O(N)，其中N为字符串长度。

（2）空间复杂度是26^n级别的，非常庞大（可采用二维数组实现改善）。

它有3个基本性质：

根节点不包含字符，除根节点外每一个节点都只包含一个字符。

从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。

每个节点的所有子节点包含的字符都不相同。

Trie树的实现

（1）使用链表来创建树。可以省下很大的空间，却增加了时间复杂度。

（2）使用二维数组来创建

插入步骤：

首先判断字符是否存在，不存在就新建一个节点，存在的话就共享，判断下一个字符，判断到最后一个字符，并标记一下结束。

（根据具体要求，采取不同的标记方法）。

查询步骤：

跟插入类似，判断字符是否存在，若存在，继续判断下一个字符，若不存在，返回0。

Trie树的应用：

（1）字符串的检索

（2）求字符串的最长公共子序列

（3）将字符串进行排序

（4）字符串的频率统计

（5）字符串的前缀匹配

（6）作为其他数据结构和算法的辅助结构。

代码实现：

（1）链表实现：

typedef struct node

{

int cnt;

node *next[26];

};

node root;

void CreateTrie(char *str) // 创建Trie树

{

int len=strlen(str);

node *p=&root;

node *q;;

for (int i=0;i< len;i++)

{

int id=str[i]-'a';

if (p->next[id]==NULL)

{

q=(node*)malloc(sizeof(node));

q->cnt=1;

for (int j=0;j<26;j++)

q->next[j]=NULL;

p->next[id]=q;

p=p->next[id];

}

else

{

p->next[id]->cnt++;

p=p->next[id];

}

int FindTire(char *str) // 查询

{

int len=strlen(str);

node *p=&root;

for (int i=0;i< len;i++)

{

int id=str[i]-'a';

p=p->next[id];

if (p==NULL)

return 0;

}

return p->cnt;

}

void DeleteTire(node *root) // Trie树的销毁

{

for (int i=0;i<10;i++)

if (root->next[i]!=NULL)

DeleteTire(root->next[i]);

free(root);

}1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950

下图是对单词hat、hap、my、new、npc建立的一个字典树

很容易理解，假如有两个单词拥有相同的前缀，例如hat、hap，”ha”只需新建一次。

字典树Tire的一个小总结

（2）数组实现：

int chara[200001][26];

int vis[200001]; // 用来标记前缀出现的次数

int e=1; // 出现的新节点的个数

void Insert(char *str) // 建立Trie树

{

int len=strlen(str);

int i,p=1;

for (int i=0;i<len;i++)

{

int id=str[i]-'a';

if (chara[p][id]==0) // 出现新的节点

{

e++;

chara[p][id]=e;

vis[e]=0;

}

p=chara[p][id];

vis[p]++;

}

int Search(char *str) // 查询

{

int len=strlen(str);

int i,p=1;

for (i=0; i<len; i++)

{

int id=str[i]-'a';

if (chara[p][id]==0)

return 0;

p=chara[p][id];

}

return vis[p];

}123456789101112131415161718192021222324252627282930313233

数组跟链表是类似的，也用上个例子来解释吧。

字典树Tire的一个小总结

这里的数字就代表着字母所在节点的位置（按照单词的先后顺序），还是拿hat、hap来解释一下吧，”ha”都是出现在单词的前两位，所以建立一次就可以了。建立单词hat时，（”ha”已经建立过）第三位出现新的节点，节点数加1，同样的，在建立hap时，第三位出现新的节点，节点数加1，这里需要注意（根结点编号为1），因为”t”已经占据第4个节点，再加1，就是第5个节点了。即chara[ 3 ] [ 15 ] = 5.

其实如果想要更好的理解这个算法，应该自己在纸上自己写出来步骤，这样可以帮助理解。

以上就是我对字典树的理解了，可能也不是多好，有问题的地方还请大家多多指教。

---------------------

作者：你呢

来源：CSDN

原文：https://blog.csdn.net/BestFM/article/details/80100127

字典树Tire的一个小总结

继续阅读

八大排序算法（Java实现）+自制动画

算法导论8-5思考题-平均排序-average sorting

POJ题目分类（不定期更新）

绳索数据结构（字符串快速拼接）

Count ways to reach the n’th stair Count ways to reach the n’th stair

符合泊松分布的事件模拟到达时间生成符合泊松分布的事件模拟到达时间生成

相隔为1的编辑距离

Algorithms Review: Divide and Conquer(Binary Search & Merge Sort)

watermark performance standard &amp; algorithms

Visual Tracking 和 Motion Estimation的区别

[zz]The Most Important Algorithms (in CS and Math)

High-level Synthesis from AutoESL: A Game-changer for Chip Design

采用ODC改善软件质量：一个案例研究

各种二分查找

查找算法学习之二分查找（Python版本）——BinarySearch

一道某高大上互联网公司的笔试题分享