摘要: 定义:数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用信息和知识的过程。-大量的:大数定律(频数和概率之间的关系)-不完全的:缺失值-噪声:仪器/测量/保护隐私人为的,就是偏离真实值的干扰数据-模糊性:事物本身从属概念的不确定性;随机性:事件发生与否的不确定性;均是不确定性;《模糊集的应用》、《概率统计》数据挖掘与知识发现(Knowledge Discovery in Database, KDD)互为别名数据挖掘:--------------------------------1、 关联(associa 阅读全文
posted @ 2014-02-09 00:43 i邓子x86 阅读(517) 评论(0) 推荐(0)