【ACWING】 Trie树并查集堆

1 Tire树

Tire树的用途

高效的存储和查找字符串集合

我个人认为这个存储字符串的过程非常像哈夫曼树，但是这并不准确。

我过段时间有空会录一小段视频讲解这部分，

2 并查集

非常常用的数据结构，思路非常巧妙。

3 堆

这里我们的堆构造成一维数组，从下标1开始存储,设某个节点为x，那么类似完全二叉树，左儿子下标2x，右儿子下标2x+1,堆的大小为size

插入一个数 heap[++size] = x; up(size);
求堆中最小值 heap[1];
删除最小值 heap[1] = heap[size]; size --; down(1);
删除任意元素 'heap[k] = heap[size]; size --; down(k)或者是up(k)'
修改任意元素 heap[k] = x; down(k)+up(k)

#include <iostream>
#include <string>
using namespace std;

const int N = 1e5 + 10;

int heap[N];
int cnt = 0;

// 这里有两种写法，一种就是用递归，一种用循环
void siftUp(int i)
{
    int parent = (i-1) / 2;
    // while(i > 0 && heap[i] > heap[parent]){
    //     swap(heap[i], heap[parent]);
    //     i = parent;
    //     parent = (i-1) / 2;
    // }
    if(i > 0 && heap[i] > heap[parent]){
        swap(heap[i], heap[parent]);
        siftUp(parent);
    }
}   

void siftDown(int i)
{
    int largest = i;
    int leftChild = 2*i + 1;
    int rightChild = 2*i + 2;

    if(leftChild < cnt && heap[leftChild] > heap[largest]){
        largest = leftChild;
    }

    if(rightChild < cnt && heap[rightChild] > heap[largest]){
        largest = rightChild;
    }

    if(largest != i)
    {
        swap(heap[i], heap[largest]);
        siftDown(largest);
    }

}


void push(int x){
    heap[cnt] = x;
    siftUp(cnt);
    cnt ++;
}

void top()
{
    if(cnt == 0)
    {
        cout<< "empty" << endl;
    }else{
        cout<< heap[0] << endl;
    }
}

void pop()
{
    if(cnt == 0)
    {
        cout << "empty" << endl;
    }else{
        cout << heap[0] << endl;

        heap[0] = heap[cnt - 1];
        cnt --;
        if(cnt != 0)
        {
            siftDown(0);
        }
    }
}

int main() {
    int n; 
    cin>> n;
    while(n--)
    {
        string s;
        cin>>s;
        // cout<< s<< endl;

        if(s == "push"){
            int num;
            cin >> num;
            // cout << num << endl;
            push(num);
        }else if(s == "top"){
            top();
        }else if(s == "pop"){
            pop();
        }
        
    }
    return 0;
}

4 哈希表

哈希表一般只涉及添加、查找元素，很少有删除元素的需要，如果非要删除，就再开一个数组，作为标记位

最简单的Hash函数：x mod n,n为哈希表长，建议这里n取值取一个质数并且要尽可能远离2的整数次幂（减少冲突）
对于有负数的出现，哈希函数写成((x % N) + N) % N，因为负数取模结果也为负数，这么写可以变成正数

1. 冲突处理

1.1 开放地址法

只开一个数组，但是数组长度通常为2-3倍

注意，这里null代表int中的无穷大，算法竞赛中通常用0x3f3f3f3f来代表无穷大

#include <iostream>
#include <cstring>      //要用到memset
using namespace std;

const int N = 200003, null = 0x3f3f3f3f;
int h[N];

int find(int x )    //找到哈希地址
{
    int k = (x % N + N) % N ;
    while(h[k]!= null && h[k]!=x){    // 坑位被占了or不等于x（已经插入x，搜索的时候用到）
        k++;
        if(k == N) k = 0;    //到末尾了就从头开始
    }
    return k;
}

int main()
{
    int n;
    cin>>n;
    
    memset(h,0x3f,sizeof h);    //memset是按字节赋值的，一个int是4字节，那么一个整数就会有4个0x3f

    while(n -- )
    {
        char op[2];
        cin>>op;
        int x;
        cin>>x;
        int k = find(x);
        if(*op == 'I'){
            h[k] = x;
        }else{
            if(h[k] != null) puts("Yes");
            else puts("No");
        }
    }
    return 0;
}

个人还是喜欢这个写法，只用一个数组，并且将插入和搜索都集合在一个find函数中，非常的nice

1.2 拉链法

存储结构类似邻接表，h[k]表示一个头节点，头节点维护一个单链表e[idx],ne[idx] 所以h[k]中存的是idx

//插入新节点的时候
void insert(int x ){
    int k = (x % N + N) % N ;      //计算哈希值
    e[idx] = x;    // 先存x的值
    ne[idx] = h[k];  //ne[]指向h[k]的原来指向的值，也就是在头节点后插入一个元素
    h[k] = idx ++;  //头节点存idx索引，用来找到我们的单链表。
}

2. 字符串hash存储

字符串前缀哈希法

用于比较同一字符串的两个切片是否相同时，有奇效

随意给一个字符串，比如str = ABCDEFG,我们能够构造一个哈希数组，来存储前缀子串的哈希值

h[0] = 0, h[1] = "A"的哈希值, h[2] = "AB"的哈希值, h[3] ="ABC"的哈希值, h[4] = "ABCD"的哈希值 ...

如何求字符串的哈希值： 将字符串看成一个P进制的数

比如现在我有一个字符串"ABCD"，将其看成P进制数，那么相应的哈希值为

// "ABCD"
(A*p^3+B*P^2+C*P+D) % Q

字符串哈希图解

这里有两点要注意：

就是上述做法中不能产生哈希值 = 0的情况，在存字符串的时候，从下标1 开始存储
当P进制取的足够好，几乎不产生冲突。一般P取 131或13331， Q取2^64
在算法中，我们定义一个typedef unsigned long long ULL; 这个是一个无符号64位数，取值范围[0，2^64-1]，相当于自动 mod Q了

建议看具体例题acwing 843字符串哈希

posted @ 2023-01-19 21:04 wenli7363 阅读(43) 评论(0) 收藏举报

刷新页面返回顶部

【ACWING】 Trie树 并查集 堆