摘要: 数字序列预测 "Github地址" "Kaggle地址" 提交Kaggle之后是0.05680 阅读全文
posted @ 2016-08-19 22:47 lijingpeng 阅读(304) 评论(0) 推荐(0) 编辑
摘要: Titanic 沉没 参见:https://github.com/lijingpeng/kaggle 这是一个分类任务,特征包含离散特征和连续特征,数据如下: "Kaggle地址" 。目标是根据数据特征预测一个人是否能在泰坦尼克的沉没事故中存活下来。接下来解释下数据的格式: 载入数据并分析 Pcla 阅读全文
posted @ 2016-08-19 14:49 lijingpeng 阅读(1146) 评论(0) 推荐(0) 编辑
摘要: "kaggle地址" 数据预览 首先载入数据集 label pixel0 pixel1 pixel2 pixel3 pixel4 pixel5 pixel6 pixel7 \ 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 2 1 0 0 0 0 0 0 0 0 3 阅读全文
posted @ 2016-08-19 14:46 lijingpeng 阅读(1350) 评论(0) 推荐(0) 编辑
摘要: "kaggle地址" "github地址" 特点: 1. 离散特征 2. 离散特征二值化处理 数据概览 预览训练集 Dates Category Descript \ 0 2015 05 13 23:53:00 WARRANTS WARRANT ARREST 1 2015 05 13 23:53:0 阅读全文
posted @ 2016-08-19 14:45 lijingpeng 阅读(2083) 评论(0) 推荐(0) 编辑
摘要: 电影文本情感分类 "Github地址" "Kaggle地址" 这个任务主要是对电影评论文本进行情感分类,主要分为正面评论和负面评论,所以是一个二分类问题,二分类模型我们可以选取一些常见的模型比如贝叶斯、逻辑回归等,这里挑战之一是文本内容的向量化,因此,我们首先尝试基于TF IDF的向量化方法,然后尝 阅读全文
posted @ 2016-08-19 14:44 lijingpeng 阅读(10941) 评论(1) 推荐(1) 编辑