摘要: 在上一篇文章中,我们简略介绍了与时间序列相关的应用,这次我们聚焦于时间序列的预测,讲讲与之相关的那些事。 1. 效果评估 设 y 是时间序列的真实值, yhat 是模型的预测值。在分类模型中由于y是离散的,有很多维度可以去刻画预测的效果。但现在的y是连续的,工具一下子就少了很多。时间序列里比较常用的 阅读全文
posted @ 2018-07-29 11:19 JSong 阅读(17350) 评论(1) 推荐(1) 编辑
摘要: 我们把按照时间次序排列的随机变量序列 $$Y_0,\, Y_1,\, Y_2, \cdots $$ 称为时间序列(Time Series)。比如网站的PV、DAU,国家的GDP,股票的价格等。 这种特别的次序给模型提出了特别的挑战,包含数据内的自相关性、不可交换性、以及数据和参数的不平稳性等。 时间 阅读全文
posted @ 2018-05-19 14:48 JSong 阅读(2539) 评论(0) 推荐(0) 编辑
摘要: reportgen v0.1.8 更新介绍 这段时间,我对 reportgen 进行了大工程量的修改和更新。将之前在各个文章中出现的函数进行了封装,同时也对现有工具包的一些逻辑进行了调整。 1、reportgen 简介 reportgen 的底层是 pptx 文件生成接口,它能非常方便的将DataF 阅读全文
posted @ 2018-03-29 17:00 JSong 阅读(6019) 评论(1) 推荐(1) 编辑
摘要: 利用 Kaggle 上的 Lending Club 数据进行模型调参学习。同时也系统整理了 Bias-variance 分解、集成学习框架的偏差方差分解、一些调参技巧等 阅读全文
posted @ 2018-03-22 22:37 JSong 阅读(2401) 评论(1) 推荐(0) 编辑
摘要: 作者:JSong 时间:2018.01.14 评分卡可以用来预测客户的好坏。当一个评分卡已经构建完成,并且有一组个人分数和其对应的好坏状态的数据时,我们想知道所构建的评分卡是否可靠?可靠程度如何?而这取决于如何去定义这个“好”字。一般有三种角度可以来评估: 评分卡分类划分的准确程度,如错误率、准确率 阅读全文
posted @ 2018-01-14 20:30 JSong 阅读(7480) 评论(0) 推荐(0) 编辑
摘要: 时间:JSong 时间:2018.01.14 文章很长,理论和实现都讲的很细,大家可以先收藏,有时间再看。 在上一篇文章中,我们对LendingClub的数据有了一个大致的了解,这次我将带大家把10万多条、145个字段的原始数据一步一步处理成建模所需输入的数据。 我们先按照上次一样导入数据,这里我将 阅读全文
posted @ 2018-01-14 19:37 JSong 阅读(14359) 评论(4) 推荐(1) 编辑
摘要: 作者:JSong 时间:2017.12 我想通过几篇文章,给评分卡的全流程一个中等粒度的介绍。另外我的本职工作不是消费金融的数据分析,所以本系列的文章会偏技术一些。 数据分析工具主要有Python3及pandas、sklearn等科学计算包,另外也会有自己的工具包reportgen。 信用记录数据采 阅读全文
posted @ 2018-01-14 19:24 JSong 阅读(14270) 评论(1) 推荐(2) 编辑
摘要: 数学视角下的共线性问题 多重共线性是使用线性回归算法时经常要面对的一个问题。在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每次拆分只有一个变量参与,这种建模机制含有抗多重共线性干扰的功能;后者干脆假定变量之间是相互独立的,因此从表面上看,也没有多重共线性的问题。但是对于回归算法,不论是一般回归,逻辑回归,或存活分析,都要同时考虑多个预测因子,因此多重共线性是不可避免需要面对的,在很多时候,多重共线性是一个普遍的现象。在构造预测模型时如何处理多重共线性是一个比较微妙的议题。既不能不加控制,又不能一刀切,认为凡是多重共线性就应该消除。 阅读全文
posted @ 2017-12-18 22:31 JSong 阅读(3004) 评论(0) 推荐(2) 编辑
摘要: 2017-11-01 宋老师 JSong 原文:JSong公众号 用户体验的工作可以说是用户需求和用户认知的分析。而消费者的声音是其中很重要的一环,它包含了用户对产品的评论,不管是好的坏的,都将对我们产品的改进和迭代有帮助。另外任何事情都要考虑金钱成本和人力成本,因此我希望能通过机器学习的算法来辅助 阅读全文
posted @ 2017-11-02 20:18 JSong 阅读(2118) 评论(0) 推荐(3) 编辑
该文被密码保护。 阅读全文
posted @ 2017-10-12 00:00 JSong 阅读(5) 评论(0) 推荐(0) 编辑