04 2018 档案

摘要:如何在Jupyter里以不同的运行模式使用Pyspark 阅读全文
posted @ 2018-04-28 15:10 風酱 阅读(2995) 评论(0) 推荐(0)
摘要:宏平均微平均的概念 阅读全文
posted @ 2018-04-13 18:09 風酱 阅读(11133) 评论(2) 推荐(1)
摘要:docker镜像 阅读全文
posted @ 2018-04-12 16:41 風酱 阅读(1567) 评论(0) 推荐(0)
摘要:随机森林 随机森林的“随机”体现在两个部分: 使用boostrap随机抽样(通俗点说就是有放回的随机抽样),假设原先数据集有N个样本,每次仍然抽出来N个样本,进行M次抽样,组成M个数据集(也就是抽M次,每次抽N个),每个单独的数据集都用来训练一颗单独的决策树T 选取特征进行分裂的时候,随机选取 k 阅读全文
posted @ 2018-04-04 09:45 風酱 阅读(658) 评论(0) 推荐(0)