字典树(Trie树)

字典树在多个单词匹配长句或者求单词的相似前缀时非常好用。

下面是他的结构:

字典树的每一条边就是一个字母,按照单词字母顺序给节点排序号。

这里用二维数组代表线段树的结构:\(tree[i][j]=k\)

\(i\)代表节点序号,\(j\)代表是上一个节点下面的哪个字母节点(\(a-z\)分为\(0-25\)),\(k\)代表下一个节点的序号。

如果要查找单词还需要一个is_end数组来记录保存哪些节点是末节点。

下面是字典树的插入节点函数:

void insert(string s,int node)//node从0开始
{
	for (int i = 0; s[i]; i++)
	{
		int num = s[i] - 'a';
		if (trie[node][num] == 0)
			trie[node][num] = ++tot;//全部变量,让序号一直增长
		node = trie[node][num];//获取下一个点的序号
	}
	//is_end[node] = 1;//如果到了终点给下一个节点赋结束符
}

查找函数:

bool find(string s,int node)//找前缀或者找单词
{
	for (int i = 0; s[i] ; i++)
	{
		int num = s[i] - 'a';
		if (trie[node][num] == 0)
			return 0;
		node = trie[node][num];
	}
	//if (is_end(node))//查找单词的时候使用,判断是否是末节点就可以了
		return 1;
	//else
		//return 0;
}

附上一道字典树的题和代码:P2580 于是他错误的点名开始了

#include<bits/stdc++.h>
using namespace std;

const int MAXN = 300000 + 10;

int tree[MAXN][26];
int is_end[MAXN];
int tot;

void insert(string s)
{
	int node = 0;
	for (int i = 0; s[i]; i++)
	{
		int t = s[i] - 'a';
		if (tree[node][t] == 0)
			tree[node][t] = ++tot;
		node = tree[node][t];
	}
	is_end[node] = 1;
}

int find(string s)
{
	int node = 0;
	for (int i = 0; s[i]; i++)
	{
		int num = s[i] - 'a';
		if (tree[node][num] == 0)
			return 0;
		node = tree[node][num];
	}
	if (is_end[node] == 1)
	{
		is_end[node] = 2;
		return 1;
	}
	else if (is_end[node] == 2)
		return 2;
	return 0;
}

int main()
{
	int m;
	cin >> m;
	while (m--)
	{
		string name;
		cin >> name;
		insert(name);
	}
	cin >> m;
	while (m--)
	{
		string name;
		cin >> name;
		int n = find(name);
		if (n == 0)
			cout << "WRONG" << endl;
		else if (n == 1)
			cout << "OK" << endl;
		else
			cout << "REPEAT" << endl;
	}
	return 0;
}
posted @ 2019-07-11 08:56  夜烛灯花  阅读(255)  评论(0)    收藏  举报