第一章 开始数据挖掘之旅
-
概念
亲和性分析:根据样本个体之间的相似度,确定它们关系的亲疏
支持度:数据集中应验规则的次数
置信度:数据集中应验规则(条件和结论)的次数/只应验规则条件的总数
-
OneR算法
思路:选取特征值中分类效果最好(错误率最低2)的特征作为分类的依据
生活是不公平的,无论境遇如何,你只能全力以赴——霍金
亲和性分析:根据样本个体之间的相似度,确定它们关系的亲疏
支持度:数据集中应验规则的次数
置信度:数据集中应验规则(条件和结论)的次数/只应验规则条件的总数
思路:选取特征值中分类效果最好(错误率最低2)的特征作为分类的依据