上一页 1 ··· 8 9 10 11 12 13 下一页
摘要: 描述性分析过程主要用于对连续变量做描述性分析,可以输入多种类型的统计量,也可以将原始数据转换成标准Z分值饼存入当前数据集。基本统计量的计算与描述性分析简介描述性分析主要是针对数据进行基础性描述,主要用于描述变量的基本特征。SPSS中的描述性分析过程可以生成相关的描述性统计量,如:均值、方差、标准差、全距、峰度和偏度,同时描述性分析过程还将原始数据转换为Z分值并作为变量储存,通过这些描述性统计量,我们可以对变量的综合特征进行全面的了解。表示集中趋势的统计量(1)均值均值分析可以分为算数平均数、调和平均数以及集合平均数三种。算数平均数 算术平均数是集中趋势最常用、最重要的测度值。他是将总体标志总量 阅读全文
posted @ 2011-10-23 16:07 data->intelligence 阅读(31382) 评论(2) 推荐(0)
摘要: 观测量组到变量组的重组使数据由纵向格式转换为横向格式,步骤如下:1)选择重组变量。在“重组数据向导”对话框中选择“将选定个案重组为变量”单选按钮,单击“下一步”按钮,弹出“重组数据向导--第2步(功步)”对话框。从“当前文件中的变量”列表框中选择在重组后将在数据集中标识观测记录的变量,单击右箭头按钮将其选入“标识符变量”列表;选择构成新数据集中变量组的变量,单击右箭头将其选入“索引变量”列表。本例中,将“观测量”变量选入“标识符变量”列表,将“D”变量 选入 “索引变量”列表。2)原始数据的排序设置。单击“下一步”按钮,弹出“重组数据向导--第3步(共5步)”该对话框用于设置是否对原始数据进行 阅读全文
posted @ 2011-10-19 06:47 data->intelligence 阅读(1073) 评论(0) 推荐(0)
摘要: 不同的分析方法需要不同的数据文件结构,当现有的数据文件结构与将要进行分析所要求的数据结构不一致时,我们需要进行数据文件结构的重组,一般来说数据文件的结构分析为横向和纵向两种结构。横向结构横向结构的数据将一个变量组中的不同分类分别作为不同的变量,例如将A,B,C作用下的数值分别作为一个变量进行保存,每一个组是一个观测量,如图:纵向结构纵向结构的数据将一个变量组中的不同分类分别作为不同的观测量,例如将A,B,C组作用下的数值作为一个观测量,如图:数据重组方式的选择在菜单栏中一次选择“数据”|“重组”命令,打开如下所示“重组数据向导”对话框。该对话框提供了三种数据重组方式,分别是“将选定变量组重组为 阅读全文
posted @ 2011-10-18 07:41 data->intelligence 阅读(1939) 评论(0) 推荐(0)
摘要: C5.0是决策树模型中的算法,79年由J R Quinlan发展,并提出了ID3算法,主要针对离散型属性数据,其后又不断的改进,形成C4.5,它在ID3基础上增加了队连续属性的离散化。C5.0是C4.5应用于大数据集上的分类算法,主要在执行效率和内存使用方面进行了改进。C4.5算法是ID3算法的修订版,采用GainRatio来加以改进方法,选取有最大GainRatio的分割变量作为准则,避免ID3算法过度配适的问题。C5.0算法则是C4.5算法的修订版,适用于处理大数据集,采用Boosting方式提高模型准确率,又称为BoostingTrees,在软件上计算速度比较快,占用的内存资源较少。决策 阅读全文
posted @ 2011-10-12 15:58 data->intelligence 阅读(28777) 评论(1) 推荐(2)
摘要: 通过数据库导出交易数据时,经常是一些没有经过处理的交易原始数据格式,如下图:然而我们希望DBA能够哪怕多写一条语句把记录上述记录写成如下的格式:那么如果DBA不能满足我们的需求,就需要我们自己来使用Excel实现上述的表格,这里现列举两种方法。方法一:使用高级筛选和sumif()函数实现首先选择数据|高级弹出如下的对话框列表区域选中A1:B14,条件区域仍旧选中A1:B14,勾选‘选择不重复的记录’,并且‘将结果复制到其他位置’,结果如下:这样我们就完成了第一步,把重复的数据ID删除,变成不重复的ID列表,之后在合并每一种物品ID的数量。在E2位置输入=SUMIF(A2:B14,D2,B2:B 阅读全文
posted @ 2011-09-25 13:41 data->intelligence 阅读(4331) 评论(2) 推荐(0)
摘要: SPSS Clenmentines提供众多的预测模型,这使得它们可以应用在多种商业领域中:如超市商品如何摆放可以提高销量;分析商场营销的打折方案,以制定新的更为有效的方案;保险公司分析以往的理赔案例,以推出新的保险品种等等,具有很强的商业价值。超市典型案例如何摆放超市的商品引导消费者购物从而提高销量,这对大型连锁超市来说是一个现实的营销问题。关联规则模型自它诞生之时为此类问题提供了一种科学的解决方法。该模型利用数据挖掘的技术,在海量数据中依据该模型的独特算法发现数据内在的规律性联系,进而提供具有洞察力的分析解决方案。通过一则超市销售商品的案例,利用“关联规则模型”,来分析商品交易流水数据,以其 阅读全文
posted @ 2011-08-25 21:50 data->intelligence 阅读(8591) 评论(0) 推荐(1)
摘要: 刚才在Excel小组有人问Excel问如何计算年龄(工龄)的问题,其实方法特别多,这里就说一个方法使用Yearfrac和int函数来计算。语法YEARFRAC(start_date,end_date,basis)要点应使用 DATE 函数输入日期,或者将函数作为其他公式或函数的结果输入。例如,使用函数 DATE(2008,5,23) 输入 2008 年 5 月 23 日。如果日期以文本形式输入,则会出现问题。Start_date为一个代表开始日期的日期。End_date为终止日期。Basis为日计数基准类型。Basis日计数基准0 或省略US (NASD) 30/3601实际天数/实际天数2实 阅读全文
posted @ 2011-08-18 17:22 data->intelligence 阅读(2166) 评论(0) 推荐(0)
摘要: 看了小蚊子的博客关于Excel多条件匹配的文章,自己也尝试一下,发现实际操作还真的是会学到更多的东西。目前Excel多条件匹配的方法主要有三种:SUMPRODUCT函数,SUMIFS函数(注意不是sumif),高级筛选功能1.SUMPRODUCT()在给定的几组数组中,将数组间对应的元素相乘,并返回乘积之和。语法SUMPRODUCT(array1,array2,array3, ...)Array1, array2, array3, ...为 2 到 255 个数组,其相应元素需要进行相乘并求和。说明数组参数必须具有相同的维数,否则,函数 SUMPRODUCT 将返回错误值 #VALUE!。函数 阅读全文
posted @ 2011-08-18 15:19 data->intelligence 阅读(12498) 评论(0) 推荐(0)
摘要: 昨天做了两个数据库表的连接查询操作,发现连接以后的记录与原始数据表里面的记录不一致,但是如果去一行一行的找这个不相同的位置,也不好找,尽管SQL能够解决这个问题,但是我想能否通过最简单的Excel来解决这个问题,也就是说把操作前后两列记录拿出来,进行对比,找出不一样的记录。比较A列与B列数据是否重复,应该有三种结果(即AB皆有,A有B无,B有A无),可在C列存放A有B无的数据,在D列存放B有A无的数据,方法如下:在C1单元格输入公式:=IF(COUNTIF($B:$B,A1)=0,A1,"")在D1单元格输入公式:=IF(COUNTIF($A:$A,B1)=0,B1,&qu 阅读全文
posted @ 2011-08-04 08:07 data->intelligence 阅读(3511) 评论(0) 推荐(0)
摘要: 之前说过MySQL的时间字段有date,time,datetime,timestamp等,在实际查询时间段时,我们经常将整个字段存储进去,例如像2011-03-10 00:00:00,也有分开存储年,月,日的方式,或者使用right()等字符截取函数来进行查询操作。Anyway,我们都是要对一段时间进行查询。笔者最近在做游戏道具购买方面的查询,按照需要,我们要按照周的方式,查询一周的道具销售量。使用的方式为下面的这种:select count(*) from table where buytime>='2011-5-31 00:00:00' and buytime< 阅读全文
posted @ 2011-08-02 08:58 data->intelligence 阅读(11901) 评论(2) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 下一页