随笔分类 -  其他

摘要:前几天面试算法岗遇到这样一道题目:给定一个实时的数据流,分别是员工ID,员工入职时间或者时员工离职时间,要求设计函数返回当时在公司工作时间最长的员工ID。 因为我做题太少的原因,当时针对这一题很多没搞清楚,在回学校仔细思考后,给出下面的解答,并以此为戒,多做题!!!! 首先最简单的思路是用单向链表存 阅读全文
posted @ 2019-02-28 21:20 Ruidongch 阅读(515) 评论(0) 推荐(0)
摘要:主要按照https://www.jianshu.com/p/a86ccd96b78a教程在mac上配置hadoop3.1.1伪分布式 配置完伪分布式文件后,在hadoop目录下第一次运行 ./bin/hdfs namenode -format ./sbin/start-dfs.sh 发现不能打开98 阅读全文
posted @ 2018-11-27 14:12 Ruidongch 阅读(247) 评论(0) 推荐(0)
摘要:业界一直在谈论大数据,对于统计而言,大数据其实意味着要不是样本量增加n→∞,要不就是维度的增加p→∞,亦或者两者同时增加,并且维度与样本量的增长速度呈线性或者指数型增长。在稀疏性的假设条件下,再加上一些正则性方法,统计学家可以证明各种加penalty的模型所给出的参数估计具有良好的统计性质,收敛速度 阅读全文
posted @ 2017-07-28 09:58 Ruidongch 阅读(1829) 评论(0) 推荐(0)