毛阳阳10月31日随笔

描述性统计分析方法是指应用分类制表图形及概括性数据指标。如均值方差等来概括数据分布特征的方法。而推断性统计分析方法则是通过随机抽样应用统计方法把从医院本书就得到的结论推广到总体的数据分析方法。

统计上需要把样本数据所含信息进行概括融合和抽象,从而得到反映样本数据的综合指标。这些指标称为统计量,描述数据特征的统计量可以分为两类。一类表示数据的中心位置,如均值,中位数,众数等。另一类表示数据的离散程度,如方差,标准差极差等,用来衡量个体偏离中心的程度。对于给定的类落入这个类的个案数成为频率。落入该类中的个案数和个案总数的比例称为相对频率,频率分析主要通过频率分布表,条形图,饼图和直方图。以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。中新趋势是指一组数据向某个中心值靠拢的倾向。描述数据分布的中心位置的统计量称为位置统计量,对于连续变量或称为尺度变量的定序变量。描述数据中心趋势的指标有均值,中位数,众数,5%,结尾,均值,对于地形数据名义数据描述数据,中期趋势的指标只有众数。截止一般是指数指的算术均值,算术平均数是数据中心趋势的主要度量指标。数据的均值,如易受极端值的影响,俺是cs的描述性分析,提供5%结尾举止,他们是把观测值升序排列后剔除掉最小的5%和最大的5%后的数据的算术均值。将观测值按照从小到大的顺序排列,位于中间位置的数值称为中位数。种树是观测值中出现次数最多的数值,即反映了这组观测值的集中趋势。种树是地球数据节能使用的中心趋势指标,但中暑可以用于尺度数据。种树不一定唯一甚至有时候众数不存在。均值的标准误用来衡量不同样本的均值之间的差别。

如果两个样本均值的差值与标准误的比值小于负二或大于二则,可以断定两个均值有显著的差别劲儿锻炼这两个样本来自于两个不同的总体。如果数据的度测量尺度相差太大或者是数据的量纲不一样,这时直接比较二者的标准差并不合适,需要首先消除测量尺度和量纲的影响。分位数又称为百分位数,是一种位置指标。百分之p分位数是指使得至少有百分之p的数据小于或等于这个值。且使得至少有(100-p)%的数据大于或等于这个值。p%所以尾数位置的计算公式为i=(p/100)×n,即将数据按照从小到大进行排序,第i个位置的数即为p%分位数。前面所讲到的中位数就是第50分位数。四分位数就是将观测数值按从小到大进行排序。然后分成四等份儿。处于三个分割点位置的观测值就是四分位数。最小的四分位数称为下四分位数记为Q1,有1/4的观测值小于下四分位数。3/4的观测值大于下四分位数。终点位置的四分位数就是中位数。最大的四分位数称为上四分位数,记为q3。所有观测值中有四分只收到观测值小于上四分位数。1/4大于上四分位数。

posted @ 2019-10-31 19:04  不能骑食铁兽  阅读(199)  评论(0)    收藏  举报