摘要: 统计量是样本的函数,它不依赖与任何未知参数。 推断统计学的重要作用就是通过在总体中抽取样本构造适当的统计量,由样本性质去推断关于总体的性质。 常用统计量: 样本均值;样本方差;样本变异系数;样本K阶矩;样本K阶中心矩;样本偏度;样本峰度; 由正态分布导出的几个重要分布: 1.抽样分布 2.卡方分布 阅读全文
posted @ 2019-11-24 20:24 钠离子 阅读(314) 评论(0) 推荐(0) 编辑
摘要: 使用excel可以直接计算二项分布和超几何分布: 阅读全文
posted @ 2019-11-24 17:54 钠离子 阅读(177) 评论(0) 推荐(0) 编辑
摘要: 阅读材料为 第四章。 开头先来一个总体内容的概括好了: 集中趋势:众数、中位数、平均数 离散程度:异众比率、四分位差、极差、平均差、方差或标准差、离散系数 分布的形状:偏态系数、峰态系数 集中趋势: 分类数据: 众数:一般情况下,只有在数据量较大的时候众数才有意义。 众数可能不存在,也可能有多个。 阅读全文
posted @ 2019-11-10 22:29 钠离子 阅读(368) 评论(0) 推荐(0) 编辑
摘要: 瞎逼逼:虽然是统计专业,但学艺不精。大学受过的专业训练很少,妥妥学渣。因此工作后决定重新复习,阅读材料为贾俊平的《统计学》第7版。每周更新。 我不按照书里的逻辑顺序和所有知识点来写我的笔记,我写那些与我的工作比较有关的东西(想想之后觉得可以应用到工作中的数据的那些知识点),还会写写我觉得可以怎样应用 阅读全文
posted @ 2019-11-03 15:54 钠离子 阅读(413) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2018-08-21 10:08 钠离子 阅读(183) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2018-08-21 10:03 钠离子 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 闭包的编写套路: def outer(a,b): def inner(x): ....... return ... return inner def outer(a,b): def inner(x): ....... return ... return inner outer称为外函数 inner称 阅读全文
posted @ 2018-08-20 11:40 钠离子 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 原始数据如下图: 程序: Mapper类: Reducer类: Driver类: 阅读全文
posted @ 2017-08-28 00:52 钠离子 阅读(709) 评论(0) 推荐(0) 编辑
摘要: MappeReduce的一般程序流程由三个类组成——Mapper类,Reduce类,Driver类。 Mapper类: 敲黑板!重点:第十二行,IntWritable v = new IntWritable(); 重点二:当我们在第十行写完的时候,关于第十四十五十六行的内容可以由自动生成的方式生成。 阅读全文
posted @ 2017-08-27 23:48 钠离子 阅读(225) 评论(0) 推荐(0) 编辑
摘要: 这里介绍MapReduce常用的几种输入输出格式。 三种常用的输入格式:TextInputFormat , SequenceFileInputFormat , KeyValueInputFormat . 1) TextInputFormat 为默认格式。不特地指明 MapReduce 的输入格式时, 阅读全文
posted @ 2017-08-25 23:31 钠离子 阅读(355) 评论(0) 推荐(0) 编辑