数据挖掘解决什么问题
1.分类问题------对已知类别的数据进行学习,为新的内容标注一个类别
比如判断一个新闻是社会新闻还是娱乐新闻
2.聚类的类别预先是不清楚的,比较适合一些不确定的类别场景
比如捡到的大堆树叶不清楚各自是从哪种树上掉下来,根据大小形状等等划分
3.回归问题------通过构建一个模型去拟合已知的数据(自变量),然后预测因变量的结果
最大特点是生成的结果是连续的
不同于分类和聚类数据是离散的
回归问题比如使用回归的方法预测北京某房子的总价(y)。假设总价只跟房子的面积(x)有关,构建的方程式就是ax+b=y

浙公网安备 33010602011771号