随笔分类 -  面试

摘要:题目说明:40亿个非负整数中找到没出现的数 题目要求:最多使用1GB内存 实现思路:32位无符号整数的范围是0~4294967295,现在有一个正好包含40亿个无符号整数的文件,所以在整个范围中必然有没出现过的数。可以使用最多1GB的内存,怎么找到所有没出现过的数? 如果用整数数组来保存出现过的数, 阅读全文
posted @ 2019-08-07 17:29 virus丶舒 阅读(187) 评论(0) 推荐(0)
摘要:题目说明 有一个包含20亿个全是32位整数的大文件,在其中找到出现次数最多的数。 题目要求 内存限制为2GB。 实现思路 想要在很多整数中找到出现次数最多的数,通常的做法是使用哈希表对出现的每 一个数做词频统计,哈希表的key是某一个整数,value是这个数出现的次数。就本题来说,一共有20亿个数, 阅读全文
posted @ 2019-08-07 17:28 virus丶舒 阅读(1301) 评论(0) 推荐(0)
摘要:线性回归算法的基本原理 概念: 线性回归模型试图学得一个通过特征的线性组合来进行预测的函数.如果特征和结果都满足线性, 即不大于一次方, 系数确定之后, 那么模型就得以确定.许多功能更为强大的非线性模型可在线性模型的基础上,通过引入层级结构或高维映射而得. 实现: 1. 最小二乘法 选择未知参数, 阅读全文
posted @ 2019-06-18 17:42 virus丶舒 阅读(149) 评论(0) 推荐(0)