【ACWING】 Trie树 并查集 堆

1 Tire树

Tire树的用途

高效的存储和查找字符串集合

我个人认为这个存储字符串的过程非常像哈夫曼树,但是这并不准确。

我过段时间有空会录一小段视频讲解这部分,


2 并查集

非常常用的数据结构,思路非常巧妙。


3 堆

这里我们的堆构造成一维数组,从下标1开始存储,设某个节点为x,那么类似完全二叉树,左儿子下标2x,右儿子下标2x+1,堆的大小为size

  1. 插入一个数 heap[++size] = x; up(size);
  2. 求堆中最小值 heap[1];
  3. 删除最小值 heap[1] = heap[size]; size --; down(1);
  4. 删除任意元素 'heap[k] = heap[size]; size --; down(k)或者是up(k)'
  5. 修改任意元素 heap[k] = x; down(k)+up(k)
#include <iostream>
#include <string>
using namespace std;

const int N = 1e5 + 10;

int heap[N];
int cnt = 0;

// 这里有两种写法,一种就是用递归,一种用循环
void siftUp(int i)
{
    int parent = (i-1) / 2;
    // while(i > 0 && heap[i] > heap[parent]){
    //     swap(heap[i], heap[parent]);
    //     i = parent;
    //     parent = (i-1) / 2;
    // }
    if(i > 0 && heap[i] > heap[parent]){
        swap(heap[i], heap[parent]);
        siftUp(parent);
    }
}   

void siftDown(int i)
{
    int largest = i;
    int leftChild = 2*i + 1;
    int rightChild = 2*i + 2;

    if(leftChild < cnt && heap[leftChild] > heap[largest]){
        largest = leftChild;
    }

    if(rightChild < cnt && heap[rightChild] > heap[largest]){
        largest = rightChild;
    }

    if(largest != i)
    {
        swap(heap[i], heap[largest]);
        siftDown(largest);
    }

}


void push(int x){
    heap[cnt] = x;
    siftUp(cnt);
    cnt ++;
}

void top()
{
    if(cnt == 0)
    {
        cout<< "empty" << endl;
    }else{
        cout<< heap[0] << endl;
    }
}

void pop()
{
    if(cnt == 0)
    {
        cout << "empty" << endl;
    }else{
        cout << heap[0] << endl;

        heap[0] = heap[cnt - 1];
        cnt --;
        if(cnt != 0)
        {
            siftDown(0);
        }
    }
}

int main() {
    int n; 
    cin>> n;
    while(n--)
    {
        string s;
        cin>>s;
        // cout<< s<< endl;

        if(s == "push"){
            int num;
            cin >> num;
            // cout << num << endl;
            push(num);
        }else if(s == "top"){
            top();
        }else if(s == "pop"){
            pop();
        }
        
    }
    return 0;
}


4 哈希表

哈希表一般只涉及添加、查找元素,很少有删除元素的需要,如果非要删除,就再开一个数组,作为标记位

最简单的Hash函数:x mod n,n为哈希表长,建议这里n取值 取一个质数 并且要尽可能远离2的整数次幂(减少冲突)
对于有负数的出现,哈希函数写成((x % N) + N) % N,因为负数取模结果也为负数,这么写可以变成正数

1. 冲突处理

1.1 开放地址法

只开一个数组,但是数组长度通常为2-3倍

注意,这里null代表int中的无穷大,算法竞赛中通常用0x3f3f3f3f来代表无穷大

#include <iostream>
#include <cstring>      //要用到memset
using namespace std;

const int N = 200003, null = 0x3f3f3f3f;
int h[N];

int find(int x )    //找到哈希地址
{
    int k = (x % N + N) % N ;
    while(h[k]!= null && h[k]!=x){    // 坑位被占了or不等于x(已经插入x,搜索的时候用到)
        k++;
        if(k == N) k = 0;    //到末尾了就从头开始
    }
    return k;
}

int main()
{
    int n;
    cin>>n;
    
    memset(h,0x3f,sizeof h);    //memset是按字节赋值的,一个int是4字节,那么一个整数就会有4个0x3f

    while(n -- )
    {
        char op[2];
        cin>>op;
        int x;
        cin>>x;
        int k = find(x);
        if(*op == 'I'){
            h[k] = x;
        }else{
            if(h[k] != null) puts("Yes");
            else puts("No");
        }
    }
    return 0;
}

个人还是喜欢这个写法,只用一个数组,并且将插入和搜索都集合在一个find函数中,非常的nice

1.2 拉链法

存储结构类似邻接表,h[k]表示一个头节点,头节点维护一个单链表e[idx],ne[idx] 所以h[k]中存的是idx

//插入新节点的时候
void insert(int x ){
    int k = (x % N + N) % N ;      //计算哈希值
    e[idx] = x;    // 先存x的值
    ne[idx] = h[k];  //ne[]指向h[k]的原来指向的值,也就是在头节点后插入一个元素
    h[k] = idx ++;  //头节点存idx索引,用来找到我们的单链表。
}

2. 字符串hash存储

字符串前缀哈希法

用于比较同一字符串的两个切片是否相同时,有奇效

随意给一个字符串,比如str = ABCDEFG,我们能够构造一个哈希数组,来存储前缀子串的哈希值

h[0] = 0, h[1] = "A"的哈希值, h[2] = "AB"的哈希值, h[3] ="ABC"的哈希值, h[4] = "ABCD"的哈希值 ...

如何求字符串的哈希值将字符串看成一个P进制的数

比如现在我有一个字符串"ABCD",将其看成P进制数,那么相应的哈希值为

// "ABCD"
(A*p^3+B*P^2+C*P+D) % Q

字符串哈希图解

这里有两点要注意:

就是上述做法中不能产生哈希值 = 0的情况,在存字符串的时候,从下标1 开始存储
当P进制取的足够好,几乎不产生冲突。 一般P取 131或13331, Q取2^64
在算法中,我们定义一个typedef unsigned long long ULL; 这个是一个无符号64位数,取值范围[0,2^64-1],相当于自动 mod Q

建议看具体例题acwing 843字符串哈希

posted @ 2023-01-19 21:04  wenli7363  阅读(39)  评论(0)    收藏  举报