11 2018 档案

如何在hadoop上做等频离散化
摘要:抛砖引玉,先根据特征值group by,统计每个特征值出现次数,然后reduce到一个文件,根据一个文件来统计吧,毕竟,你知道多个桶,那么每个桶多少个样本就是确定了,数数,数到一个桶样本的时候停止,就是一个阈值呗 阅读全文

posted @ 2018-11-15 19:36 dmesg 阅读(379) 评论(0) 推荐(0)

那些年在某厂踩过的坑
摘要:某厂人多势众,自己造轮子,不用开源,于是可苦了外来人,外来所有积累的经验都没有用了,同时在这个厂积累的经验到外面又没啥用。呵呵 自己造的轮子,文档极少,遇到坑了只能找客服,客服毛个态度,爱管不管,没法子啊,又不给资源,用不了开源,这个坑只能自己一点一点趟。 需要在某个o平台上用t库,但是o平台自带的 阅读全文

posted @ 2018-11-13 11:18 dmesg 阅读(138) 评论(0) 推荐(0)