摘要: AB_test是一个常用方法和考点,本文通过基础讲解+重点提示+案例分析的方式进行讲解: 虽然本文既附带很多公式并阐述原理,同时力求讲清what,why,how,但十分建议看的人多少要有点统计学功底。 一、基本介绍 1.1 Why:为什么要用它 比如更新了一个新功能,是否会对产品有正向作用,主观猜测 阅读全文
posted @ 2024-04-17 17:46 勁 阅读(356) 评论(0) 推荐(0)
摘要: 突然看到一个问题,自动排班,想了一下,这主要是个逻辑问题,自行手动实现: 基于以下假设: 假设1.工厂,机器24小时不停转,人工作12小时换班,人不可连续上两个班; 一般一次排一周的表,排一个月感觉不太实际,Mon_1即表示周一白班,_2即周一夜班; 假设2.比如有10台机器,至少需要20个人,一般 阅读全文
posted @ 2024-04-11 15:02 勁 阅读(156) 评论(0) 推荐(0)
摘要: 数据源:Superstore Dataset (kaggle.com) 一个超市2011到2014年销售数据,51290 rows × 24 columns,简单看看,本文不涉及算法; 需要的知识:numpy,pandas,pyecharts,seaborn 需要明白:数据是一个企业的核心,即便很多 阅读全文
posted @ 2024-04-08 17:48 勁 阅读(75) 评论(0) 推荐(0)
摘要: 自定义类,实现线性回归和岭回归,完成主体部分,一个字--清爽简洁。 内容: 1.简单复制粘贴下数学原理 2.代码及测试 3.思考 一、数学原理 由于数学公式太多,直接粘贴了; 图片复制自:Python手写实现线性回归(从原理到代码) - 知乎 (zhihu.com) python机器学习手写算法系列 阅读全文
posted @ 2024-04-04 19:20 勁 阅读(31) 评论(0) 推荐(0)
摘要: kaggle的数据集 Rossmann Store Sales | Kaggle 要求: 给了我们一个train,一个store数据集,同时要我们预测test数据集,即未来6周旗下1115个门店销售数据,注意test没有给我们顾客人数; 以前搞过的kaggle数据集,现在重写一遍,虽然数据集有点老了 阅读全文
posted @ 2024-03-25 01:38 勁 阅读(21) 评论(0) 推荐(0)
摘要: FB1 WARNING:本文不含LightGBM原理解释,主要讲重要参数(较一般文章多、新)以及演示案例,文章中有相当部分的官网英文,担心自己翻译带有个人色彩,故摘选原文,如果英语太差看起来可能会有点蛋疼。 文章内容: (1)一些基本介绍 (2)sklearn全部可见参数+少许其他参数 (3)原生接 阅读全文
posted @ 2024-03-11 15:18 勁 阅读(232) 评论(0) 推荐(0)
摘要: 会先写一些思考和结论,力求每一步把重点直白点写出来,4万字 一、数据相关情况及背景 (1)数据源,kaggle上的Credit Card Fraud Detection (kaggle.com) 国内好像想搞到还不是那么容易,附带个百度盘链接,文件143MB 链接:https://pan.baidu 阅读全文
posted @ 2024-03-05 01:36 勁 阅读(53) 评论(0) 推荐(0)
摘要: 目的:本来想看一下lineplot的其他参数是什么意思,在网上找了一些文章,基本都只是介绍了一部分,或者对errorbar的介绍不太满意,想着这东西本身也不是很难,参数也没有那么多,索性自己对照官网和一些文章,写一篇,把lineplot(scatterplot),relplot的所有参数都以案例可视 阅读全文
posted @ 2024-01-10 15:06 勁 阅读(18) 评论(0) 推荐(0)
摘要: 本文不含XGboost的Loss定义、分裂原理,但会讲一下比较难理解的,需要对原理非常清楚,不然你可能不知道我要表达的意思 >主要写一些难懂的参数解释和实际应用,顺便做个小笔记,自己忘了也可以来抄一下,因参数很多,挑一些主要的说: 内容: 1.原生接口案例,参数解释 2.sklearn接口GridS 阅读全文
posted @ 2024-01-06 13:57 勁 阅读(136) 评论(0) 推荐(0)