09 2017 档案

摘要:R语言与DataFrame 什么是DataFrame 引用 r-tutor上的定义: DataFrame 是一个表格或者类似二维数组的结构,它的各行表示一个实例,各列表示一个变量。 没错,DataFrame就是类似于Excel表格和MySQL数据库一样是一个结构化的数据体。而这种结构化的数据体是当代 阅读全文
posted @ 2017-09-19 15:36 ywliao 阅读(992) 评论(0) 推荐(0)
摘要:机器学习中的数据不平衡问题 最近碰到一个问题,其中的阳性数据比阴性数据少很多,这样的数据集在进行机器学习的时候会使得学习到的模型更偏向于预测结果为阴性。查找了相关的一些文献,了解了一些解决这个问题的一些方法和技术。 首先,数据集不平衡会造成怎样的问题呢。一般的学习器都有下面的两个假设:一个是使得学习 阅读全文
posted @ 2017-09-15 16:46 ywliao 阅读(334) 评论(0) 推荐(0)