随笔分类 - 其他
摘要:前几天面试算法岗遇到这样一道题目:给定一个实时的数据流,分别是员工ID,员工入职时间或者时员工离职时间,要求设计函数返回当时在公司工作时间最长的员工ID。 因为我做题太少的原因,当时针对这一题很多没搞清楚,在回学校仔细思考后,给出下面的解答,并以此为戒,多做题!!!! 首先最简单的思路是用单向链表存
阅读全文
摘要:主要按照https://www.jianshu.com/p/a86ccd96b78a教程在mac上配置hadoop3.1.1伪分布式 配置完伪分布式文件后,在hadoop目录下第一次运行 ./bin/hdfs namenode -format ./sbin/start-dfs.sh 发现不能打开98
阅读全文
摘要:业界一直在谈论大数据,对于统计而言,大数据其实意味着要不是样本量增加n→∞,要不就是维度的增加p→∞,亦或者两者同时增加,并且维度与样本量的增长速度呈线性或者指数型增长。在稀疏性的假设条件下,再加上一些正则性方法,统计学家可以证明各种加penalty的模型所给出的参数估计具有良好的统计性质,收敛速度
阅读全文

浙公网安备 33010602011771号