摘要:注1:本文旨在梳理汇总出我们在建模过程中遇到的零碎小问题及解决方案(即当作一份答疑文档),会不定期更新,不断完善, 也欢迎大家提问,我会填写进来。 注2:感谢阅读。为方便您查找想要问题的答案,可以就本页按快捷键Ctrl+F,搜索关键词查找,谢谢。 1. 读写csv文件时,存在新的一列,Unnamed 阅读全文
posted @ 2019-07-24 09:39 likedata 阅读 (27) 评论 (0) 编辑
摘要:一、通过HTML方式 插入本地图片 使用 <img src> 语句插入本地图片,其中src为图片路径,可以是相对路径或绝对路径。 <img src="./jupyter_logo.png", width=320, heigth=240> 上述语句为插入当前目录下名为“jupy 阅读全文
posted @ 2019-08-21 12:26 likedata 阅读 (2) 评论 (0) 编辑
摘要:阅读全文
posted @ 2019-08-21 12:19 likedata 阅读 (2) 评论 (0) 编辑
摘要:记得在做电商运营初期,每每为我们频道的促销活动锁取得的“超高”销售额感动,但后来随着工作的深入,我越来越觉得这里面水很深。商家运营、品类运营不断的通过刷单来获取其所需,或是商品搜索排名,或是某种kpi指标,但这些所谓的“脏数据”,却妨碍了平台运营者对于真实数据的分析和促销效果的评估。今天我们讨论一种 阅读全文
posted @ 2019-08-21 12:09 likedata 阅读 (2) 评论 (0) 编辑
摘要:阅读全文
posted @ 2019-08-20 22:05 likedata 阅读 (3) 评论 (0) 编辑
摘要:1. 写Python代码,根据PEP8风格,默认一行的长度不超过 80 个字符。 但是pycharm 默认是第 120 个字符处,故进行修改: File→Settings→Editor→Code Style→Hard wrap at ___ columns的值设为80 阅读全文
posted @ 2019-08-05 17:34 likedata 阅读 (13) 评论 (0) 编辑
摘要:显著性水平α与P值: 1、显著性水平是估计总体参数落在某一区间内,可能犯错误的概率,用α表示。 显著性是对差异的程度而言的,是在进行假设检验前确定的一个可允许作为判断界限的小概率标准。 2、P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。 P值(P value)就 阅读全文
posted @ 2019-07-29 17:25 likedata 阅读 (10) 评论 (0) 编辑
摘要:注1:本文旨在梳理汇总出我们在建模过程中遇到的零碎小问题及解决方案(即当作一份答疑文档),会不定期更新,不断完善, 也欢迎大家提问,我会填写进来。 注2:感谢阅读。为方便您查找想要问题的答案,可以就本页按快捷键Ctrl+F,搜索关键词查找,谢谢。 1. 读写csv文件时,存在新的一列,Unnamed 阅读全文
posted @ 2019-07-24 09:39 likedata 阅读 (27) 评论 (0) 编辑
摘要:安装过程: 1. 首先我们引入jupyter_contrib_nbextension这个第三方库。 2. 在Anaconda Promot中输入命令: pip install jupyter_contrib_nbextensions && jupyter contrib nbextension in 阅读全文
posted @ 2019-07-22 13:03 likedata 阅读 (75) 评论 (0) 编辑
摘要:我们在推导机器学习公式时,常常会用到各种各样的对数,但是奇怪的是--我们往往会忽略对数的底数是谁,不管是2,e,10等。 原因在于,lnx,log2x,log10x,之间是存在常数倍关系。 回顾学过的数学知识,换底公式如下: 则有 故我们不用纠结对数公式中底数究竟是谁,常数倍关系往往对最后结果不产生 阅读全文
posted @ 2019-07-22 10:34 likedata 阅读 (48) 评论 (0) 编辑
摘要:①自变量不能相关,即排除自相关性,还有共线性;②变量一定要显著。③变量要独立同分布。 所以我们要进行共线性筛查,显著性筛查,相关性筛查,才能选择出入模变量。 9. 逻辑回归创建评分卡模型核心步骤: a) 变量分箱,可以排除异常值的影响,分法有等宽、等频、人工指定分箱、C4.5决策树、卡方分箱。 b) 阅读全文
posted @ 2019-07-15 00:33 likedata 阅读 (63) 评论 (0) 编辑