随笔分类 -  数据挖掘

摘要:在本节中,我们介绍Softmax回归模型,该模型是logistic回归模型在多分类问题上的推广,在多分类问题中,类标签 可以取两个以上的值。 Softmax回归模型对于诸如MNIST手写数字分类等问题是很有用的,该问题的目的是辨识10个不同的单个数字。Softmax回归是有监督的,不过后面也会介绍它 阅读全文
posted @ 2018-08-23 22:33 IronJJ 阅读(165) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2018-04-22 11:40 IronJJ 阅读(146) 评论(0) 推荐(0)
摘要:数据分类数据分类就是建立模型把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征来对数据进行区别。这个模型称为分类器,预测分类的(无序,离散)类标号。数据分类通常分为两个过程,学习阶段(模型构建)和分类阶段(预测类标号)。例如下图我们预测客户是否会购买计算... 阅读全文
posted @ 2018-03-29 21:25 IronJJ 阅读(2850) 评论(0) 推荐(0)
摘要:数据离散化数据离散化的一种常用方法是依据数据的相关性程度进行离散化,最常见的算法就是ChiMerge算法定义chimerge是基于chi-squre的,监督的,自底向上(合并的)一种数据离散化方法。卡方检验 xyz Ax1y1z1aBx2y2z2b xyzN统计AB属... 阅读全文
posted @ 2018-03-17 17:23 IronJJ 阅读(3512) 评论(1) 推荐(0)