会员
众包
新闻
博问
闪存
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
钠离子
博客园
首页
新随笔
联系
订阅
管理
2019年11月24日
4 统计量&抽样分布
摘要: 统计量是样本的函数,它不依赖与任何未知参数。 推断统计学的重要作用就是通过在总体中抽取样本构造适当的统计量,由样本性质去推断关于总体的性质。 常用统计量: 样本均值;样本方差;样本变异系数;样本K阶矩;样本K阶中心矩;样本偏度;样本峰度; 由正态分布导出的几个重要分布: 1.抽样分布 2.卡方分布
阅读全文
posted @ 2019-11-24 20:24 钠离子
阅读(314)
评论(0)
推荐(0)
编辑
3 概率的基本概念&离散型随机变量
摘要: 使用excel可以直接计算二项分布和超几何分布:
阅读全文
posted @ 2019-11-24 17:54 钠离子
阅读(177)
评论(0)
推荐(0)
编辑
2019年11月10日
2 数据的概括性度量
摘要: 阅读材料为 第四章。 开头先来一个总体内容的概括好了: 集中趋势:众数、中位数、平均数 离散程度:异众比率、四分位差、极差、平均差、方差或标准差、离散系数 分布的形状:偏态系数、峰态系数 集中趋势: 分类数据: 众数:一般情况下,只有在数据量较大的时候众数才有意义。 众数可能不存在,也可能有多个。
阅读全文
posted @ 2019-11-10 22:29 钠离子
阅读(368)
评论(0)
推荐(0)
编辑
2019年11月3日
1 数据 & 图表
摘要: 瞎逼逼:虽然是统计专业,但学艺不精。大学受过的专业训练很少,妥妥学渣。因此工作后决定重新复习,阅读材料为贾俊平的《统计学》第7版。每周更新。 我不按照书里的逻辑顺序和所有知识点来写我的笔记,我写那些与我的工作比较有关的东西(想想之后觉得可以应用到工作中的数据的那些知识点),还会写写我觉得可以怎样应用
阅读全文
posted @ 2019-11-03 15:54 钠离子
阅读(413)
评论(0)
推荐(0)
编辑
2018年8月21日
Python 函数知识点整理
摘要:
阅读全文
posted @ 2018-08-21 10:08 钠离子
阅读(183)
评论(0)
推荐(0)
编辑
list,tuple,dict,set 思维导图整理
摘要:
阅读全文
posted @ 2018-08-21 10:03 钠离子
阅读(180)
评论(0)
推荐(0)
编辑
2018年8月20日
Python 闭包
摘要: 闭包的编写套路: def outer(a,b): def inner(x): ....... return ... return inner def outer(a,b): def inner(x): ....... return ... return inner outer称为外函数 inner称
阅读全文
posted @ 2018-08-20 11:40 钠离子
阅读(156)
评论(0)
推荐(0)
编辑
2017年8月28日
一个自动修正数据时间和补全缺失数据的MapReduce程序
摘要: 原始数据如下图: 程序: Mapper类: Reducer类: Driver类:
阅读全文
posted @ 2017-08-28 00:52 钠离子
阅读(709)
评论(0)
推荐(0)
编辑
2017年8月27日
MapReduce原理
摘要: MappeReduce的一般程序流程由三个类组成——Mapper类,Reduce类,Driver类。 Mapper类: 敲黑板!重点:第十二行,IntWritable v = new IntWritable(); 重点二:当我们在第十行写完的时候,关于第十四十五十六行的内容可以由自动生成的方式生成。
阅读全文
posted @ 2017-08-27 23:48 钠离子
阅读(225)
评论(0)
推荐(0)
编辑
2017年8月25日
Hadoop MapReduce常用输入输出格式
摘要: 这里介绍MapReduce常用的几种输入输出格式。 三种常用的输入格式:TextInputFormat , SequenceFileInputFormat , KeyValueInputFormat . 1) TextInputFormat 为默认格式。不特地指明 MapReduce 的输入格式时,
阅读全文
posted @ 2017-08-25 23:31 钠离子
阅读(355)
评论(0)
推荐(0)
编辑
公告