摘要: 整理自《大数据算法》(王志宏 哈尔滨工业大学)31页 问题描述 给定一个数据流,从这个流中进行均匀采样。 要求在接收到n个数据后,能够等概率地输出其中的k个数据。 已知n远大于k,且现有的内存空间无法容纳所有数据。 算法描述 准备一个长度为k的数组用于保存样本。 将接收到的前k个数据保存在数组中,然 阅读全文
posted @ 2020-12-19 19:54 x3477 阅读(372) 评论(0) 推荐(0)
摘要: 整理自《大数据算法》(王志宏 哈尔滨工业大学)24页 问题描述 给定一个由0、1构成的数组,在不遍历整个数组的情况下,判断它是否为全0数组。 算法描述 从数组中随机抽取s个元素,如果样本全是0,就认为它是全0数组。 算法分析 对于全0数组来说,无论抽取多少个元素看到的都是0,不会发生误判; 对于含有 阅读全文
posted @ 2020-12-19 19:13 x3477 阅读(1168) 评论(0) 推荐(0)