摘要: 空 阅读全文
posted @ 2020-11-04 23:54 Leo叶 阅读(76) 评论(0) 推荐(0)
摘要: 1. 验证集Trainning set/交叉验证集Cross validation set/测试集 Test set 2. 模型开发的方向 - 学习曲线 偏差Bias跟Variance方差的平衡 正则化曲线 超参数曲线 数据曲线 3.模型评价及选择 - Precision 跟 Recall 的bal 阅读全文
posted @ 2020-11-01 23:37 Leo叶 阅读(69) 评论(0) 推荐(0)
摘要: Neuron Network 神经网络的权重系数矩阵维度 前向传播表示 神经网络的损失函数表示 整体m个样本 神经网络的梯度下降公式 (拿证回补) 梯度检验 - gradient checking 神经网络的Back propagation - 误差传递 其中可看作是对于aj(l)的“误差” 阅读全文
posted @ 2020-10-31 00:46 Leo叶 阅读(71) 评论(0) 推荐(0)
摘要: 1.数据质量QC 2.高质量的Campaign活动交付 3. 呼叫中心名单建模优化 - 建2个模型分类,或者一个模型出来: 将客户为为 - 不打也要,打了就要,不打不要,打了也不要。尽量targeting 打了就要,不打不要这波人 4. 金融客户分群实践 ( spend,revolver,tcr,聚 阅读全文
posted @ 2020-10-30 11:11 Leo叶 阅读(97) 评论(0) 推荐(0)
摘要: 理论是高度通用的,但到最终落地的过程中,需要丰富的数据/业务知识, 以及一些tricks 一些长期实战摸索出来的经验,虽然够不上有多高的理论高度,但就像Hary Potter无意间得到的Half Blood Prince写在课本里的实验备注,寥寥几语,做起试验来非常有用,有意想不到的效果 最近有个优 阅读全文
posted @ 2020-10-22 13:19 Leo叶 阅读(1048) 评论(0) 推荐(0)
摘要: 计划须突出编程实践 1a. 工具类-python, 1b. GCP 基础/ BIG Query / Dataproc / Pipeline + model + SAS automation , 1c. SQL 1d. Git 1e. Markdown - Blogs 2a. 生产中的数据分析分类分析 阅读全文
posted @ 2020-10-19 10:45 Leo叶 阅读(243) 评论(0) 推荐(0)
摘要: 1. 利用数据字典建立框架,无系统,就不是自己的 2. 抓住每一个业务模块中,最重要最系统全面的大报表进行学习 数据源模块 -- 看数据源是哪些,数据源的数据范围,数据结构,存储粒度 -- 是如何抓取的,加了哪些限制条件,限制条件代表的意思 -- 总会有一些数据没有那么干净,怎么处理的 数据处理过程 阅读全文
posted @ 2020-10-08 17:06 Leo叶 阅读(306) 评论(0) 推荐(0)
摘要: 第一周 深度学习概论 1.1 课程体系 AI 是新电力,对所有领域带来改变,最显著的部分是Deep learning 课程分5个部分 (一) 神经网络跟深度学习 (二) 深度学习提升:超参数调整,正则化,优化 (三) 结构化ML项目(工程化问题)- 相对独立 (四) CNN 构建 (五) NLP: 阅读全文
posted @ 2020-09-24 01:00 Leo叶 阅读(485) 评论(0) 推荐(0)
摘要: 1. Lift 2.PSI 3.KS值 4.Gini 5.Shap 6.Mob/Vintage 阅读全文
posted @ 2020-09-18 10:37 Leo叶 阅读(181) 评论(0) 推荐(0)
摘要: 数据报表实践中的问题 1. 同一业务KPI,可能存在非常多元的提取逻辑 - 数据源不同,存在数据收集层面的差异; - 业务定义多样,不统一; 两份报告中的同一KPI有不同的意思 - 同一定义,但在某些报表中因特定需求,存在特别限定。 2. 业务要求每个单独报表全面,相关KPI全都要,重复开发 3. 阅读全文
posted @ 2020-09-15 15:30 Leo叶 阅读(549) 评论(0) 推荐(0)