摘要: 一、AIC(Akaike information Criterion)准则 二、BIC(Bayesian information Criterion)准则 参考文献: 【1】AIC与BIC区别 阅读全文
posted @ 2019-03-19 20:01 nxf_rabbit75 阅读(2236) 评论(0) 推荐(0)
摘要: 一、堆 1.最小堆 【Python heapq模块】 heap为定义堆,item增加的元素 heapq.heappush(heap,item) 将列表转换为堆 heapq.heapify(list) 删除最小值,因为堆的特征是heap[0]永远是最小的元素,所以一般都是删除第一个元素 heapq.h 阅读全文
posted @ 2019-03-19 19:21 nxf_rabbit75 阅读(497) 评论(0) 推荐(1)
摘要: 这类题目,首先需要确定可用内存的大小,然后确定数据的大小,由这两个参数就可以确定hash函数应该怎么设置才能保证每个文件的大小都不超过内存的大小,从而可以保证每个小的文件都能被一次性加载到内存中。 1. 如何从大量的url中找到相同的url? 题目描述:给定a、b两个文件,各存放50亿个url,每个 阅读全文
posted @ 2019-03-19 15:12 nxf_rabbit75 阅读(1609) 评论(0) 推荐(0)