摘要: 决策树(decision tree)一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。优点: 1) 可以生成可以理解的规则; 2) 计算量相对来说不是很大; 3) 可以处理连续和种类字段; 4) 决策树可以清晰的显示哪些字段比较重要。缺点: 1) 对连续性的字段比较难预测; 2) 对有时间顺序的数据,需要很多预处理的工作; 3) 当类别太多时,错误可能就会增加的比较快; 4) 一般的算法分类的时候,只是根据一个字段来分类。(racoon)一、C 5.0算法 执行效率和内存使用改进、... 阅读全文
posted @ 2012-06-21 15:02 dekevin 阅读(7904) 评论(0) 推荐(0)
摘要: TwoStep Cluster属于近年来才发展起来的智能聚类方法的一种,用于解决海量数据,复杂类别结构时的聚类分析问题。与传统的层次聚类和快速聚类法相比,两步聚类法有鲜明的特点。首先,用于聚类的变量可以使连续变量,也可以是离散变量,不必像其他算法那样,在进行聚类之前对离散变量进行连续化处理;其次,两步聚类法占用的内存资源少,对于大数据量,运算速度较快。最后,它是真正的在利用统计量作为距离指标进行聚类,同时又可以根据一定的统计标准自动地建议甚至于确定最佳的类别数。顾名思义,两步聚类是通过两个步骤来完成聚类工作。一、预聚类这一步骤通过构建和修改聚类特征树(Cluster Feature Tree) 阅读全文
posted @ 2012-06-21 14:58 dekevin 阅读(1685) 评论(0) 推荐(0)
摘要: 几个常用的统计软件下载地址,比较经典的几个地址,希望对大家学习有所帮助,顺提醒一下:请不要用于商业用途,谢谢!说明:rayfile会弹出一些广告,天下没有免费的午餐。进入下面的地址,然后安装ta的客户端,然后就可以下载了统计软件SAS8.2(含EM)http://www.rayfile.com/files/e5b43ae3-87b1-11de-a861-0014221b798a/sas8.1简装版http://www.rayfile.com/zh-cn/files/18050a9e-5de9-11dd-b48f-001143e7b41c/SPSSv16.0免注册全模块版http://www.r 阅读全文
posted @ 2012-06-15 09:24 dekevin 阅读(1169) 评论(0) 推荐(0)
摘要: 调查:2009-2010年中国商业智能(BI)市场分析[导读]从全球范围来看,商业智能(BI)领域并购不断,商业智能市场已经超过ERP和CRM成为最具增长潜力的领域。从国内来看,商业智能(BI)已经被电信、金融、零售、保险、制造等行业越来越广泛的应用,操作型BI逐步在大企业普及。商业智能是什么?商业智能英文名称Business Intelligence,简称BI,通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。目前,商业智能(BI)领域大致可划分为数据仓库、OLAP和报表展示、数据集成、数据挖掘和针对行业的解决方案等。1、概述 从全球范围来看,商业智能(BI). 阅读全文
posted @ 2012-06-15 09:22 dekevin 阅读(967) 评论(0) 推荐(0)
摘要: 不同的管理角色,其关注的层次与关键信息都是不一样的。对于企业的高层领导,平常可能就只关心几个关键的经营数据,这时,我们可以将这些关键信息以图表的方式显示在一个页面中,同时,当决策者对其中某个数据感兴趣时,可以通过鼠标操作即可进行任意钻取,直至得到问题的最终答案。Power-BI预设上百个常用企业绩效指标,可任意自定义管理角色,无须编写任何代码,即可轻松配置管理驾驶舱界面。总经理管理驾驶舱销售总监管理驾驶舱财务总监管理驾驶舱运营总监管理驾驶舱 阅读全文
posted @ 2012-06-15 09:19 dekevin 阅读(1514) 评论(0) 推荐(0)
摘要: 什么是BI(1) 老板,你要这么多数据做什么? 假如你是一个商品零售公司的老板。 你的公司很先进,已经实现了业务信息化,每一笔销售单据都保存在数据库中,日积月累,已经保存了十余年的销售数据,上亿条销售记录。 这时如果我问你:“反正三年前的数据留着也白白占地方,耗费存储成本,索性把它们全删掉吧,这样不用买硬盘就能容纳新数据,如何?” 你会从容的接受我这个建议吗? 那么老板,你要这么多数据做什么? 是的,和我一样,你也已经隐约认识到数据的价值,这就是我们割舍不下历史数据的原因,就像任何一个现代化企业,甚至就像任何一个传统的票号,如百年老店般虔诚地保存着古老的数据,因为我们有直觉,我们的直觉告诉我. 阅读全文
posted @ 2012-06-15 09:18 dekevin 阅读(2061) 评论(0) 推荐(0)
摘要: 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。 当所有维表都直接连接到“事实表”上时,整个图解就像星星一样,故将该模型称为星型模型,如图1。星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定的冗余,如在地域维度表中,存在国家A省B的城市C以及国家A省B的城市D两条记录,那么国家A和省B的信息分别存储了两次,即存在冗余。图1.销售数据仓库中的星型模型 当有一个或多个维表没有直接连接到事实表上,而是通过其他维表. 阅读全文
posted @ 2012-06-15 09:17 dekevin 阅读(674) 评论(0) 推荐(0)
摘要: 数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层——源数据、数据仓库、数据应用: 从图中可以看出数据仓库的数据来源于不同的源数据,并提供多样的数据应用,数据自上而下流入数据仓库后向上层开放应用,而数据仓库只是中间集成化数据管理的一个平台。 数据仓库从各数据源获取数据及在数据仓库内的数据转换和流动都可以认为是ETL(抽... 阅读全文
posted @ 2012-06-15 09:15 dekevin 阅读(1007) 评论(0) 推荐(0)
摘要: private void Page_Load(object sender, System.EventArgs e) { SqlConnection con=new SqlConnection("server=.;database=pubs;uid=sa;pwd=;"); con.Open(); SqlDataAdapter sda=new SqlDataAdapter(); sda.SelectCommand=new SqlCommand("select * from txtInsert",con); DataSet ds=new DataSet(); 阅读全文
posted @ 2012-06-14 10:21 dekevin 阅读(372) 评论(0) 推荐(0)
摘要: UPDATE dbo.PP_MOperationSET MOperationName_ENG=QQQQ.MOperationENNameFROM PP_MOperation,QQQQWHERE PP_MOperation.MOperationName=QQQQ.MOperationName 阅读全文
posted @ 2012-06-13 09:07 dekevin 阅读(181) 评论(0) 推荐(0)