随笔分类 -  数据挖掘

数据挖掘学习--数据仓库
摘要:一.数据仓库概念数据仓库是一个面向主题的,集成的,随时间而变化的,不容易丢失的数据集合,支持管理部分的决策过程。为统计的历史数据分析提供坚实的平台,对信息处理提供支持。二.数据仓库的关键特征1.面向主题,2.数据集成一个数据仓库是通过多个异种数据源来构造的关系数据库,一般文件,联机事物处理使用数据清理和数据集成技术命名约定,编码结构,属性变量等的一致当数据被移到数据仓库时,它们要经过转换。3.随时间变化数据仓库的时间范围比操作系统库系统要长的多操作数据库系统:主要保存当前数据数据仓库:从历史的角度提供信息(比如过去5-10年)数据仓库中的每一个关键结构都隐式或显示的包含时间元素,而操作数据库中 阅读全文
posted @ 2013-07-27 13:34 无尽的缥缈 阅读(380) 评论(0) 推荐(0)
数据挖掘学习--数据挖掘基础概念
摘要:一,数据模式概念/类描述:特性化和区分 归纳,总结和对比数据的特性。关联分析 分类和预测可以用来预报某些未知的或丢失的数据值。聚类分析将类似的数据归类到一起,形成一个新的类别进行分析 最大类内的相似性和最小化类间的相似性。比如画圈。 孤立点分析 孤立点:一些与数据的一般行为或模型不一致的孤立的数据。 通常孤立点被作为“噪音”或异常被丢弃。但是在欺事件中可以通过罕见事件进行孤点分析而得出结论。比如银行信用卡 趋势和演变分析 描述行为随事件变化的对象的发展规律或趋势。比如时间数据库 趋势和偏差:回归分析 序列模式匹配:周期性分析 基于类性的分析 其它定向模式或统计分析。曾转载过一篇博客说明几类问题 阅读全文
posted @ 2013-07-27 13:10 无尽的缥缈 阅读(385) 评论(0) 推荐(0)
保险企业中商业智能技术的应用 (转载)
摘要:本文转自http://www.dataguru.cn/article-3118-1.html摘要: 商业智能(BusinessIntelligence,BI)应用可以神奇地分析出两种看似毫不相干的东西之间原来有着千丝万缕的联系,如今以数据仓库为核心的BI应用正在成为国内很多用户们实施的热点。那么BI究竟能给保险行业带来什么,怎 ...商业智能(BusinessIntelligence,BI)应用可以神奇地分析出两种看似毫不相干的东西之间原来有着千丝万缕的联系,如今以数据仓库为核心的BI应用正在成为国内很多用户们实施的热点。那么BI究竟能给保险行业带来什么,怎样有效地利用BI是其中的关键问题。 阅读全文
posted @ 2013-05-14 17:02 无尽的缥缈 阅读(268) 评论(0) 推荐(0)
数据挖掘主要侧重解决的4类问题 (转载)
摘要:本文转自http://www.dataguru.cn/article-3136-1.html摘要: 一般来说,数据挖掘主要侧重解决四类问题:分类、聚类、关联、预测。数据挖掘非常清晰的界定了它所能解决的几类问题。这是一个高度的归纳,数据挖掘的应用就是把这几类问题演绎的一个过程。下面让我们来看看它所解决 ...一般来说,数据挖掘主要侧重解决四类问题:分类、聚类、关联、预测。数据挖掘非常清晰的界定了它所能解决的几类问题。这是一个高度的归纳,数据挖掘的应用就是把这几类问题演绎的一个过程。下面让我们来看看它所解决的四类问题是如何界定的:1、分类问题分类问题属于预测性的问题,但是它跟普通预测问题的区别在于 阅读全文
posted @ 2013-05-14 16:58 无尽的缥缈 阅读(601) 评论(0) 推荐(0)