摘要: cpc原理简述: cpc、hyperloglog等是使用概率思想实现“去重计数”的方法,该类方法不直接存储数据集合本身,而是通过一定的概率统计方法预估数据集中不重复元素的个数,这种方法可以大大节省内存,同时保证误差控制在一定范围内。 1、基本概率思想 伯努利试验:一次实验只有两种结果,比如抛硬币结果 阅读全文
posted @ 2022-02-24 14:19 数大招疯-公众号同名 阅读(435) 评论(0) 推荐(0)