2019-10-31 梁佳妮 SPSS统计学随笔作业

第三章:描述性统计分析 统计分析的目的是研究观察对象总体的特点。 其所使用的研究方法有描述性统计分析方法和推断性统计分析方法。 描述性统计分析方法是指应用分类、制表、图形及概括性数据指标(如均值、方差等)来概括数据分布特征的方法。 应用统计方法把从样本数据得到的结论推广到总体的数据分析方法。 统计上,需要把样本数据所含信息进行概括,融合和抽象,从而得到反映样本数据的综合指标。这些指标称为统计量。 描述数据特征的统计量可分为两类:一类表示数据的中心位置,如均值.中位数.众数等;另一类表示数据的离散程度,如方差.标准差.极差等用来衡量个体偏离中心的程度。 3.1:频率分析 在描述定性观测值时,需要把这些值按照某种原则分成一些组或者类,使得每个观测值必须且只能够落入一个类中。对于给定的类,落入这个类的个案数称为频率,落入该类中的个案数和个案总数的比例称为相对频率。频率分析主要通过频率分布表、条形图、饼图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。 3.2:中心趋势的描述:均值、中位数、众数、5%截尾均值 中心趋势是指一组数据向某个中心值靠拢。 描述数据分布的中心趋势的指标有均值、中位数、众数、5%截尾均值;对于定性数据(名义数据),描述数据中心趋势的指标只有众数。 注意:SPSS中把变量分为3个水平,分别为尺度变量、定序变量、名义变量。在SPSS变量编辑窗口,要恰当地定义变量的水平。这是选择正确统计方法的基础。 有的时候称尺标变量数据为连续数据,称名义变量数据为定性数据。统计学上把名义变量和定序变量统称分类变量。 3.2.1 均值(或者算术平均数) 均值一般是指数据的算术均值(算术平均数),是数据中心趋势的主要度量指标,也是实际问题中使用最多的指标。设我们考察的变量有n个观测值,他们分别记为x1,x2,…,xn,则算术均值

在频率分析中,饼图和直方图一般适用于分类变量的类别个数较少的情况,如果类别个数较多,建议选择直方图。

 

中心区是是指一组数据向某个中心值靠拢的倾向,描述数据分布的中心位置的统计量称为位置统计量,对于连续变量和定序变量描述数据中心趋势的指标有均值,中位数,众数,百分之五结尾均质,对于定性变量描述数据中心趋势的指标只有众数。

 

观测值按照从小到大的顺序排列,剔除掉排序后的数据序列两端的部分数值和计算得到的均值称为结尾。

 

众数是观测值中出现次数最多的数值,其反应了这组观测值的集中趋势。

 

众数是定性数据,仅能使用的中心区是治标,但众数可以用于制度数据。

 

今天感觉数据的中心趋势指标进行决策是不够的,例如如果一个国家的普通家庭收入差距很少,而另一个国家的差距收入差距很大,及存在大量的贫困家庭,也存在许多十分富有的家庭那,么即使这两个国家的中等收入家庭的收入完全一样,他们的家庭收入情况也仍然不同。

 

对观测者而言,其离散程度的大小就是每个观测值偏离均值的情况及该观测值与均值的差值,这个差值可以用来描述个体的变异大小,但它不能代表整体的离散程度。

 

均值的标准误用来衡量不同样本的均值之间的差别,如果两个样本均值的差值与标准误的比值小于-二或者大于二则,可以断定两个均值有着显著的差别,进而断定这两个样本来自于两个不同的总体。

 

比较两组数据离散程度大小时,如果熟悉的测量尺度相差太大,或者是数据的量纲不一样,这时直接比较二者的标准差并不合适,首先需要消除测量尺度的量钢的影响变异系数就可以提出这些影响。

 

spss的许多菜单均可以进行描述性统计分析在独立样本体检验方差分析因子分析等许多分析过程中spss自定义模块儿也可以产生大部分的描述性统计。

posted @ 2019-10-31 20:39  梁佳妮  阅读(515)  评论(0)    收藏  举报