会飞的蝌蚪君

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

文章分类 -  机器学习实战

摘要:数据处理 写在前面:在我认为,数据处理包括对数据采用可视化以及相关的形式转换,定性分析后进行一系列的变换处理。 本日记将记录笔者使用pandas进行数据处理一些心得。 1.常用的函数: 分组 groupby;整体应用apply;归并merge;联合concat; 2.在一定程度上也扩充了特征。比如性 阅读全文
posted @ 2018-04-02 21:20 会飞的蝌蚪 阅读(116) 评论(0) 推荐(0)

摘要:摘要:数据挖掘的关键在于数据的处理,业间有句话大概就是说模型的特征决定了该模型上限,而参数只是不断接近这个上限而已。 目录 1. 前言2. 数据字典3. 优雅使用pandas3.1 读取数据3.2 索引与选取3.3 布尔索引3.4 去重3.5 分组3.6 数据框的合并(1)横向合并(2)纵向合并3. 阅读全文
posted @ 2018-03-26 21:47 会飞的蝌蚪 阅读(236) 评论(0) 推荐(0)

摘要:参考链接:http://blog.csdn.net/c406495762/article/details/75172850 根据三个特征判断对人的喜好 阅读全文
posted @ 2018-03-05 22:34 会飞的蝌蚪 阅读(252) 评论(0) 推荐(0)

摘要:bar 条形图 pie 饼状图 kde 绘制密度分布曲线 1.对csv文件中某一特征进行matplot绘图: 文件名 . 特征(某一列) . plot(kind='统计特征' ) 例如: 阅读全文
posted @ 2018-01-25 22:11 会飞的蝌蚪 阅读(141) 评论(0) 推荐(0)

摘要:1.天池数据挖掘比赛技术与套路总结: http://blog.csdn.net/mr_tyting/article/details/73548245 2.各种比赛数据集下载: https://zhuanlan.zhihu.com/p/25138563 #聚数力:1562*******,1234567 阅读全文
posted @ 2018-01-25 21:01 会飞的蝌蚪 阅读(230) 评论(0) 推荐(0)

摘要:入门通道: https://bbs.aliyun.com/read/273638.html?spm=5176.100067.444.2.4ee2e2b2bpncew 天池历届大赛答辩PPT及视频: http://blog.csdn.net/levy_cui/article/details/70676 阅读全文
posted @ 2017-12-01 17:24 会飞的蝌蚪 阅读(80) 评论(0) 推荐(0)

摘要: 阅读全文
posted @ 2017-11-29 17:47 会飞的蝌蚪 阅读(100) 评论(0) 推荐(0)