随笔分类 -  Pentaho

摘要:购物篮分析:Apriori算法:参数设置:1.car 如果设为真,则会挖掘类关联规则而不是全局关联规则。2. classindex 类属性索引。如果设置为-1,最后的属性被当做类属性。3. delta 以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。4. lowerBoundMinSupport 最小支持度下界。5. metricType 度量类型。设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率(leverage),确信度(conviction)。在 Weka中设置了几个类似置信度(confidence 阅读全文
posted @ 2013-12-17 16:00 杨桃 阅读(5725) 评论(0) 推荐(0)
摘要:步骤:(一) 选择数据源(二)选择要分析的字段(三)选择需要的关联规则算法(四)点击start运行(五) 分析结果算法选择:Apriori算法参数含义1.car:如果设为真,则会挖掘类关联规则而不是全局关联规则。2.classindex: 类属性索引。如果设置为-1,最后的属性被当做类属性。3.delta: 以此数值为迭代递减单位。不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。4.lowerBoundMinSupport: 最小支持度下界。5.metricType: 度量类型,设置对规则进行排序的度量依据。可以是:置信度(类关联规则只能用置信度挖掘),提升度(lift),杠杆率( 阅读全文
posted @ 2013-12-16 11:24 杨桃 阅读(7942) 评论(0) 推荐(0)
摘要:Pentaho CE(Community Edition) 免费版本下载地址列表http://sourceforge.net/projects/pentaho/files/Pentaho 插件名称下载地址Pentaho Kettlehttp://sourceforge.net/projects/pentaho/files/Data Integration/Pentaho Reportinghttp://sourceforge.net/projects/jfreereport/files/Pentaho BI Platformhttp://sourceforge.net/projects/pen 阅读全文
posted @ 2013-11-21 10:31 杨桃 阅读(1924) 评论(0) 推荐(1)
摘要:载入数据(一)打开文件(二) 打开url(三) 打开数据库(四)从一些数据生成器(DataGenerators)中生成人造数据 这篇主要写(三)中的连接mySql 网上教程很多这里写个简单步骤 推荐一篇文章 http://blog.csdn.net/senaku/article/details/2225943 下载必要的工具 mysql驱动(有的就别下了) http://pan.baidu.com/share/link?shareid=2530503288&uk=1010575044 weka 3.6.10的(无jre版) http://pan.baidu.c... 阅读全文
posted @ 2013-10-09 11:17 杨桃 阅读(1209) 评论(0) 推荐(0)
摘要:Weka 简介 WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。 Weka是基于java,用于数据挖掘和知识分析一个平台。来自世界各地的java爱好者们都可以把自己的算法放在这个平台上,然后从海量数据中发掘其背后隐藏的种种关系;也许你只是出于对数据的狂热爱好,但也许你的发现会蕴含着无限的商机。 打开Weka,首先出现一个窗口。这是一个很简单的窗体,提供四个按钮:Simple CLI、Explorer、Experimenter、KnowledgeFlow。 Simple CL... 阅读全文
posted @ 2013-10-08 17:37 杨桃 阅读(2426) 评论(0) 推荐(0)