02 2019 档案

摘要:本文是一篇关于特征工程的总结类文章,如有不足之处或理解有偏差的地方,还望大家多多指点。 首先,给一张特征工程的思维导图: 【如果要浏览图片,建议将其下载到本地,使用图片浏览软件查看】 关于特征工程(Feature Engineering),已经是很古老很常见的话题了,坊间常说:“数据和特征决定了机器 阅读全文
posted @ 2019-02-23 16:32 marsggbo 阅读(1036) 评论(0) 推荐(0)
摘要:在使用Pytorch时经常碰见这些函数cross_entropy,CrossEntropyLoss, log_softmax, softmax。看得我头大,所以整理本文以备日后查阅。 首先要知道上面提到的这些函数一部分是来自于 torch.nn ,而另一部分则来自于 torch.nn.functio 阅读全文
posted @ 2019-02-19 15:12 marsggbo 阅读(105448) 评论(0) 推荐(7)
摘要:1、日志级别 日志一共分成5个等级,从低到高分别是:DEBUG INFO WARNING ERROR CRITICAL。 DEBUG:详细的信息,通常只出现在诊断问题上 INFO:确认一切按预期运行 WARNING:一个迹象表明,一些意想不到的事情发生了,或表明一些问题在不久的将来(例如。磁盘空间低 阅读全文
posted @ 2019-02-19 11:02 marsggbo 阅读(2012) 评论(0) 推荐(0)
摘要:如何对右偏数据进行变换 现在,我们需要分情况讨论一下。在实际生活中,最常见的情形是靠近正无穷的一侧有一个长尾巴(如图1左),习惯上称为「右偏」(right skewed)或「正偏态」(positive skewness)。许多人会有点儿困惑,觉得图上分布的那个峰明明是向左边负数一侧偏的,怎么叫「右偏 阅读全文
posted @ 2019-02-14 22:09 marsggbo 阅读(815) 评论(0) 推荐(0)
摘要:原文:http://www.cnblogs.com/jasonfreak/p/5448462.html 目录 1 使用sklearn进行数据挖掘 1.1 数据挖掘的步骤 1.2 数据初貌 1.3 关键技术 2 并行处理 2.1 整体并行处理 2.2 部分并行处理 3 流水线处理 4 自动化调参 5 阅读全文
posted @ 2019-02-14 21:37 marsggbo 阅读(524) 评论(0) 推荐(0)
摘要:原文:http://www.cnblogs.com/jasonfreak/p/5448385.html 目录 1 特征工程是什么? 2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2. 阅读全文
posted @ 2019-02-14 21:08 marsggbo 阅读(482) 评论(0) 推荐(0)