上一页 1 2 3 4 5 6 7 8 9 10 ··· 31 下一页
摘要: 代码 import pandas as pd import numpy as np import plotly.plotly as py import plotly.graph_objs as go path = '/home/v-gazh/PycharmProjects/us_data/limit 阅读全文
posted @ 2019-12-16 11:19 ZhuGaochao 阅读(2263) 评论(0) 推荐(0)
摘要: 参考链接:https://github.com/v-gazh/LearningStatsGroup/blob/master/week7/week7.ipynb 源地址:https://github.com/AeneasZhu/LearningStatsGroup/blob/master/week7/ 阅读全文
posted @ 2019-12-15 22:35 ZhuGaochao 阅读(1690) 评论(0) 推荐(0)
摘要: 代码 import pandas as pd import numpy as np import plotly.plotly as py import plotly.graph_objs as go path = '/home/v-gazh/PycharmProjects/us_data/count 阅读全文
posted @ 2019-12-12 18:49 ZhuGaochao 阅读(1251) 评论(0) 推荐(0)
摘要: outline 下午需要简单处理一份数据,就直接随手写脚本处理了,但发现效率太低,速度太慢,就改成多进程了; 程序涉及计算、文件读写,鉴于计算内容挺多的,就用多进程了(计算密集)。 代码 import pandas as pd from pathlib import Path from concur 阅读全文
posted @ 2019-12-09 15:49 ZhuGaochao 阅读(508) 评论(0) 推荐(0)
摘要: 统计量 统计学中最主要的提取信息的方式就是对原始信息进行一定的运算,得出某些代表性的数字,以反映数据某些方面的特征,这种数字被称为统计量。用统计学语言表述,统计量是样本的函数,它不依赖于任何未知函数。推断统计学的重要作用就是,通过从总体中抽取样本构造适当的统计量。 常用统计量 抽样分布 在总体X的分 阅读全文
posted @ 2019-12-08 19:29 ZhuGaochao 阅读(2852) 评论(0) 推荐(0)
摘要: 二项分布式 import numpy as np import matplotlib.pyplot as plt list = np.random.binomial(n=10, p=0.5,size = 10000) plt.hist(list, bins = 8,color = 'g', alph 阅读全文
posted @ 2019-12-01 20:14 ZhuGaochao 阅读(639) 评论(0) 推荐(0)
摘要: 基本概念 随机变量 在做实验时,常常是相对于试验结果本身而言,我们主要还是对结果的某些函数感兴趣。 例如,在掷骰子时,我们常常关心的是两颗骰子的点和数,而并不真正关心其实际结果; 就是说,我们关心的也许是其点和数为7,而并不关心其实际结果是否是(1,6)或(2,5)或(3,4)或(4,3)或(5,2 阅读全文
posted @ 2019-11-24 21:42 ZhuGaochao 阅读(866) 评论(0) 推荐(0)
摘要: 多进程是在多个进程中,一个进程的阻塞并不会影响到其他进程。比如在一个进程中进行大量的计算操作,并不会对其他进程产生较大影响。 协程就是在一个线程中,如果协程中一个任务发生阻塞,其余任务也将受到影响。比如说在一个任务中,进行大量的计算操作,那么这个任务将会阻塞其余的任务。 所以协程不适合处理计算密集型 阅读全文
posted @ 2019-11-21 21:18 ZhuGaochao 阅读(602) 评论(0) 推荐(0)
摘要: 数据的集中趋势 众数 众数是样本观测值在频数分布表中频数最多的那一组的组中值,主要应用于大面积普查研究之中。 众数是在一组数据中,出现次数最多的数据,是一组数据中的原数据,而不是相应的次数。 一组数据中的众数不止一个,如数据2、3、-1、2、1、3中,2、3都出现了两次,它们都是这组数据中的众数。 阅读全文
posted @ 2019-11-10 21:31 ZhuGaochao 阅读(1722) 评论(0) 推荐(0)
摘要: 数据预处理 数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。 数据审核 数据审核就是检查数据中是否有错误。 对于通过调查取得的原始数据(raw data),主要从完整性和准确性两个方面去审核。 完整性审核主要是检查应调查的单位或个体是否有遗漏,所有的调查项目是否 阅读全文
posted @ 2019-11-03 23:26 ZhuGaochao 阅读(594) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 7 8 9 10 ··· 31 下一页
点击右上角即可分享
微信分享提示