会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
tychyg's Blog
开心玩数据,专注于大数据、BI
博客园
首页
新随笔
联系
订阅
管理
2015年10月13日
基于IG的特征评分方法
摘要: 本文简单介绍了熵、信息增益的概念,以及如何使用信息增益对监督学习的训练样本进行评估,评估每个字段的信息量。 1、熵的介绍 在信息论里面,熵是对不确定性的测量。通俗来讲,熵就是衡量随机变量随机性的指标。比如一个随机变量X的状态有{1,2,...,n},如果X取1的概率为1,其他状态为0,那么这个随机...
阅读全文
posted @ 2015-10-13 14:52 开心玩数据
阅读(1290)
评论(0)
推荐(0)
公告