摘要: 1.Java //TODO 2.Python //TODO 3.Scala //TODO 4.Spark //TODO 5.Flink //TODO 6.ML //TODO 7.DL //TODO 8.NLP //TODO 9.Kaggle //TODO 10.Leetcode+剑指offer总结 阅读全文
posted @ 2019-04-04 22:41 0xCAFE 阅读(145) 评论(0) 推荐(0) 编辑
摘要: 1.原理 //TODO 2.Python Package Scikit-Learn API 2.1输入 数据的特征分为两类,一类是连续型,比如:体重,一种是分类型,比如性别。 在scikit-learn中的Glossary of Common Terms and API Elements有这么一段话 阅读全文
posted @ 2019-02-01 23:28 0xCAFE 阅读(442) 评论(0) 推荐(1) 编辑
摘要: //Bellman-Ford每次找到更新后的点,实际上到不了N次就收敛了,若还不收敛说明有负权回路,不是从源头开始迭代,松弛时不确保父节点已确定,因此做了很多无用功 //SPFA加入队列,从源头开始迭代,松弛时不确保父节点已确定,将松弛后的点入队 //Dijstra从源头开始迭代,找邻接点 //Fl 阅读全文
posted @ 2019-01-14 16:15 0xCAFE 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 转载自:https://www.cnblogs.com/jbelial/articles/2116074.html P01: 01背包问题 题目 有N件物品和一个容量为V的背包。第i件物品的费用是c[i],价值是w[i]。求解将哪些物品装入背包可使这些物品的费用总和不超过背包容量,且价值总和最大。 阅读全文
posted @ 2018-12-29 15:48 0xCAFE 阅读(1056) 评论(0) 推荐(2) 编辑
摘要: 父RDD的每一个分区最多被一个子RDD的分区所用,即同分区的所有key可以被映射到同一分区,这就是窄依赖,没必要进行shuffle。 宽依赖,key被映射到不同分区,需要shuffle。 spark中有两类stage,也称为task,一类是shuffleMapTask(用于shuffle),另一类是 阅读全文
posted @ 2018-12-09 00:20 0xCAFE 阅读(980) 评论(0) 推荐(0) 编辑
摘要: https://leetcode-cn.com/problems/2-keys-keyboard/description/ 题目描述 最初在一个记事本上只有一个字符 ‘A’。你每次可以对这个记事本进行两种操作: Copy All (复制全部) : 你可以复制这个记事本中的所有字符(部分的复制是不允许 阅读全文
posted @ 2018-12-08 15:24 0xCAFE 阅读(643) 评论(0) 推荐(0) 编辑
摘要: 方法到函数转换:function= method _ Nothing、Null、Unit、None 、null 、Nil理解:https://www.cnblogs.com/PerkinsZhu/p/7868012.html 打印数组内容:println(arr.toBuffer) Scala学习之 阅读全文
posted @ 2018-12-02 22:53 0xCAFE 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 单变量分布函数: 离散型: Benford Bernoulli Beta-binomial Beta-Pascal Binomial Discrete uniform Discrete Weibull Gamma-Poisson Geometric Hypergeometric Logarithm 阅读全文
posted @ 2018-11-30 13:33 0xCAFE 阅读(693) 评论(0) 推荐(0) 编辑
摘要: 目标:CentOS 7 调整 home分区 扩大 root分区总体过程:把/home内容备份,然后将/home文件系统所在的逻辑卷删除,扩大/root文件系统,新建/home ,恢复/home内容 1.查看分区df -h2.备份home分区文件tar cvf /tmp/home.tar /home3 阅读全文
posted @ 2018-09-04 14:19 0xCAFE 阅读(887) 评论(0) 推荐(0) 编辑
摘要: 以上文件中: 下面这几个可以删除 noarch文件可以不用删除 依次删除,例如: hadoop负载均衡 hdfs dfsadmin -setBalancerBandwidth 104857600 #表示设置带宽可使用100Mb hdfs balancer -threshold 5 #表示超过整个集群 阅读全文
posted @ 2018-08-30 09:54 0xCAFE 阅读(169) 评论(0) 推荐(0) 编辑