摘要: 1.第一个概念:RDD RDD(Resilient DistributedDatasets) ,弹性分布式数据集,是分布式内存的一个抽象概念,RDD提供了一种高度受限的共享内存模型,即RDD是只读的记录分区的集合,只能通过在其他RDD执行 确定的转换操作(如map、join和group by)而创建 阅读全文
posted @ 2016-07-17 14:24 也明 阅读(196) 评论(0) 推荐(0)
摘要: 最近在读吴军的《数学之美》,书里很多内容之前已经略有了解,这次有了新体会,随手记下,算是开卷有益吧。 --20160701 1. Hidden Markov Model 从对(相对静态的)随机变量的研究发展到对随机变量的时间序列S1,S2,S3..., 即随机过程(动态的)的研究。 2. 信息的作用 阅读全文
posted @ 2016-07-01 22:30 也明 阅读(127) 评论(0) 推荐(0)