摘要:R语言︱机器学习模型评估方案(以随机森林算法为例) R语言︱机器学习模型评估方案(以随机森林算法为例) 笔者寄语:本文中大多内容来自《数据挖掘之道》,本文为读书笔记。在刚刚接触机器学习的时候,觉得在监督学习之后,做一个混淆矩阵就已经足够,但是完整的机器学习解决方案并不会如此草率。需要完整的评价模型的
阅读全文
02 2017 档案
摘要:R语言︱决策树族——随机森林算法 笔者寄语:有一篇《有监督学习选择深度学习还是随机森林或支持向量机?》(作者Bio:SebastianRaschka)中提到,在日常机器学习工作或学习中,当我们遇到有监督学习相关问题时,不妨考虑下先用简单的假设空间(简单模型集合),例如线性模型逻辑回归。若效果不好,也
阅读全文
摘要:笔记︱决策树族——梯度提升树(GBDT) 笔记︱决策树族——梯度提升树(GBDT) 本笔记来源于CDA DSC,L2-R语言课程所学进行的总结。 一、介绍:梯度提升树(Gradient Boost Decision Tree) Boosting算法和树模型的结合。按次序建立多棵树,每棵树都是为了减少
阅读全文
摘要:机器学习中的过拟合问题 相关内容: 1、 R语言︱ROC曲线——分类器的性能表现评价 2、机器学习中的过拟合问题 3、R语言︱机器学习模型评估方案(以随机森林算法为例) —————————————————————————— 过拟合问题举例 右图在训练数据上拟合完美,但是预测第11个时候, 左图虽然拟
阅读全文
摘要:笔记︱范数正则化L0、L1、L2-岭回归&Lasso回归(稀疏与特征工程) 一、正则化背景 监督机器学习问题无非就是“minimizeyour error while regularizing your parameters”,也就是在规则化参数的同时最小化误差。最小化误差是为了让我们的模型拟合我们
阅读全文
摘要:R语言︱XGBoost极端梯度上升以及forecastxgb(预测)+xgboost(回归)双案例解读 R语言︱XGBoost极端梯度上升以及forecastxgb(预测)+xgboost(回归)双案例解读 XGBoost不仅仅可以用来做分类还可以做时间序列方面的预测,而且已经有人做的很好,可以见最
阅读全文
摘要:转载︱案例 基于贪心算法的特征选择 转载︱案例 基于贪心算法的特征选择 用GA算法设计22个地点之间最短旅程-R语言实现 ———————————————————————————————————————————————————————— greedy Algorithm Feature Selecti
阅读全文
摘要:工业级GBDT算法︱微软开源 的LightGBM(R包正在开发....) 看完一篇介绍文章后,第一个直觉就是这算法已经配得上工业级属性。日前看到微软已经公开了这一算法,而且已经发开Python版本,本人觉得等Hadoop+Spark这些平台配齐之后,就可以大规模宣传啦~如果R包一发我一定要第一时间学
阅读全文
摘要:R︱mlr包帮你挑选最适合数据的机器学习模型(分类、回归)+机器学习python和R互查手册 一、R语言的mlr packages install.packages("mlr")之后就可以看到R里面有哪些机器学习算法、在哪个包里面。 [html] view plain copy print? a<-
阅读全文
摘要:机器学习算法线上部署方法 机器学习算法线上部署方法 本文由携程技术中心投递,ID:ctriptech。作者:潘鹏举,携程酒店研发BI经理,负责酒店服务相关的业务建模工作,主要研究方向是用机器学习实现业务流程自动化、系统智能化、效率最优化,专注于算法实践和应用。 我们经常会碰到一个问题:用了复杂的GB
阅读全文
摘要:R语言︱常用统计方法包+机器学习包(名称、简介) R语言︱常用统计方法包+机器学习包(名称、简介) 一、一些函数包大汇总 转载于:http://www.dataguru.cn/thread-116761-1-1.html 时间上有点过期,下面的资料供大家参考基本的R包已经实现了传统多元统计的很多功能
阅读全文
摘要:R语言︱机器学习模型评价指标+(转)模型出错的四大原因及如何纠错 笔者寄语:机器学习中交叉验证的方式是主要的模型评价方法,交叉验证中用到了哪些指标呢? 交叉验证将数据分为训练数据集、测试数据集,然后通过训练数据集进行训练,通过测试数据集进行测试,验证集进行验证。 模型预测效果评价,通常用相对绝对误差
阅读全文
摘要:R语言︱H2o深度学习的一些R语言实践——H2o包 R语言H2o包的几个应用案例 笔者寄语:受启发想了解H2o平台的一些R语言实现,网上已有一篇H2o的demo文件。笔者在这多贴一些案例,并且把自己实践的一些小例子贴出来。 关于H2o平台长啥样,可以看H2o的官网,关于深度学习长啥样,可以看一些教程
阅读全文
摘要:笔记︱集成学习Ensemble Learning与树模型、Bagging 和 Boosting 本杂记摘录自文章《开发 | 为什么说集成学习模型是金融风控新的杀手锏?》 基本内容与分类见上述思维导图。 . . 一、机器学习元算法 随机森林:决策树+bagging=随机森林 梯度提升树:决策树Boos
阅读全文
摘要:笔记+R︱风控模型中变量粗筛(随机森林party包)+细筛(woe包) 笔记+R︱风控模型中变量粗筛(随机森林party包)+细筛(woe包) 本内容来源于CDA-DSC课程内容,原内容为《第16讲 汽车金融信用违约预测模型案例》。 建立违约预测模型的过程中,变量的筛选尤为重要。需要经历多次的筛选,
阅读全文
摘要:笔记︱支持向量机SVM在金融风险欺诈中应用简述 笔记︱支持向量机SVM在金融风险欺诈中应用简述 欺诈一般不用什么深入的模型进行拟合,比较看重分析员对业务的了解,从异常值就可以观测出欺诈行为轨迹。同时欺诈较多看重分类模型的召回与准确率两个指标。较多使用SVM来进行建模。 召回率,准确率,排序很准的模型
阅读全文
摘要:笔记+R︱信用风险建模中神经网络激活函数与感知器简述 一、信用风险建模中神经网络的应用 申请评分可以将神经网络+逻辑回归联合使用。 《公平信用报告法》制约,强调评分卡的可解释性。所以初始评分(申请评分)一般用回归,回归是解释力度最大的。 神经网络可用于银行行为评级以及不受该法制约监管的业务(P2P)
阅读全文
摘要:一、logit值的来源 逻辑回归一般将因变量二分类变量的0-1转变为频率[0,1],变成odds(优势比,[0,+∞]),然后log一下成为Logit值([-∞,+∞]) 优势比就是:odds=P(y=1)/P(y=0) logit值:logit=log(odds) 什么是sigmoid函数? 先定
阅读全文
摘要:本笔记源于CDA-DSC课程,由常国珍老师主讲。该训练营第一期为风控主题,培训内容十分紧凑,非常好,推荐:CDA数据科学家训练营 —————————————————————————————————————————— 一、欺诈、损失定义与分类 1、欺诈分类 欺诈与客户虚假信息识别的案例较少,因为这些案
阅读全文
摘要:笔记︱风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift) 笔记︱风控分类模型种类(决策、排序)比较与模型评估体系(ROC/gini/KS/lift) 本笔记源于CDA-DSC课程,由常国珍老师主讲。该训练营第一期为风控主题,培训内容十分紧凑,非常好,推荐:CDA数据
阅读全文
摘要:巴塞尔协议定义了金融风险类型:市场风险、作业风险、信用风险。信用风险ABC模型有进件申请评分、行为评分、催收评分。 ———————————————————————————————————— 一、数据准备 1、排除一些特定的建模客户 用于建模的客户或者申请者必须是日常审批过程中接触到的,需要排除以下两
阅读全文
摘要:一、巴塞尔协议——银行业监管手册 巴塞尔协议Ⅲ是全球银行业监管的标杆,其出台必将引发国际金融监管准则的调整和重组,影响银行的经营模式和发展战略。在巴塞尔协议Ⅲ出台之际,中国银监会及时推出了四大监管工具,包括资本要求、杠杆率、拨备率和流动性要求四大方面,及时进行了跟进,构成了未来一段时期中国银行业监管
阅读全文
摘要:ggplot2笔记 下面是ggplot2的一些文档和github上的源代码http://docs.ggplot2.org/current/https://github.com/hadley/ggplot2本篇文章涉及ggplot2: Elegant Graphics for Data Analysi
阅读全文
摘要:Decision Trees/ Machine Learning Durga Gaddam August 29, 2016 Decision Trees/ Machine Learning Durga Gaddam August 29, 2016 Objective: The objective o
阅读全文
摘要:2.OpenCV函数使用 OpenCV提供了随机森林的相关类和函数。具体使用方法如下: (1)首先利用CvRTParams定义自己的参数,其格式如下 CvRTParams::CvRTParams(int max_depth, int min_sample_count, float regressio
阅读全文
摘要:北京市融资性担保公司综合评级结果的公示 为进一步建立健全北京市融资性的支持作用,根据《中国人民银行办公厅关于全面推广小额贷款公司和融资性担保公司信用评级工作的通知》(担保机构信用评级工作长效机制,强化信用评级结果在日常监管中银办发〔2015〕92号)、《融资性担保公司管理暂行办法》(银监会等七部委令
阅读全文
摘要:http://www.mofcom.gov.cn/article/h/zongzhi/201606/20160601347305.shtml http://www.mofcom.gov.cn/article/h/zongzhi/201608/20160801377544.shtml 关于2015年度
阅读全文
摘要:http://www.circ.gov.cn/web/site0/tab4491/module12629/page1.htm 深圳众诚泰保险经纪公司由去哪儿网百分百控股。 保险代理人是根据保险人的委托,向保险人收取佣金,并在保险人授权的范围内代为办理保险业务的机构或者个人。保险代理机构包括专门从事保
阅读全文
摘要:http://www.circ.gov.cn/web/site0/tab5202/ 资本结构 序号 公司名称 原保险保费收入 1 28114195.86 2 2887633.54 3 1102631.27 4 3524116.72 5 8644784.27 6 15828824.33 7 61827
阅读全文
摘要:新规让基金子公司"牌照红利"不再耀眼 基金子公司加速蜕变 2016年06月17日 07:43来源:中国经济网 2016年06月17日 07:43来源:中国经济网 即将出台的监管新规让基金子公司“牌照红利”不再耀眼。要在资管市场中真正确立自己的竞争优势,还要在投研实力、内部设置、激励机制等诸多方面加速
阅读全文
摘要:近年来租赁公司数量快速增加,由2008年底的107家增长至2015年6月底的3185家,其中外资租赁公司在数量上增长显著。由于目前外资租赁公司的审批设立由商务部及省级商务委负责,因此审批效率较高,公司数量增速远高于其他两类租赁公司 相对而言,金融租赁公司作为金融机构,审批设立由银监会负责,并且设立标
阅读全文
摘要:衣服吊牌标签的秘密你懂吗? 衣服吊牌标签的秘密你懂吗? 你买衣服的时候注意到吊牌标签了吗,还是只看价格?吊牌和标签会告诉你一些你不知道的秘密。现在就来学学如何看吊牌标签吧! 首先我们要看级别标注。根据GB18401-2003,一般分为A、B、C三类,A类服装的面料是适合2周岁以下婴幼儿穿着的,B类服
阅读全文
摘要:为什么有些卖衣服的店是品牌,要把标签撕坏来卖,而且便宜 为什么有些卖衣服的店是品牌,要把标签撕坏来卖,而且便宜 这就是传说中的剪标衣服,,跟品牌的衣服质量是一样的。很多是因为代工厂家没有商标使用权,只能剪标出售!不过剪标很多是个噱头,大多跟正品不同! 衣服上的标签牌子到底要不要撕啊? 以前我不撕,看
阅读全文
摘要:晚上还要加班,用几分钟简要答一下,回头再修改完善。推荐题主读一本“金融市场与金融工具”方面的书就全弄清了。这几个概念并不是互相独立的,也并非都是有准确外延的。对于此,如果会找法规文件的话,完全可以从法规文件中了解其准确的含义和指向。此处暂时不讨论内涵,而通过描述外延区分之。1、信托:信托是基于信任的
阅读全文
摘要:史上最全详解资管计划、私募基金、信托计划! 史上最全详解资管计划、私募基金、信托计划! 史上最全详解资管计划、私募基金、信托计划! 资管计划vs.私募基金vs.信托计划比较 1主要监管法规 ▍1、基金公司及子公司资管计划 《基金法》《信托法》《私募暂行办法》《试点办法》《单一客户合同准则》《特定多个
阅读全文
摘要:获得《快递业务经营许可证》企业信息(截止2016.6.30) 2016-07-07 跨省(区、市)经营国内快递业务并经营国际快递业务的企业 企业名称 许可证号 有效期限 经营地域 民航快递有限责任公司 20100001A/C 2015.09.29至2020.09.28 北京市、天津市、山西省太原市、
阅读全文
摘要:1月北上广P2P平台之最 平台数成交量现双降 今日(2月9日),网贷之家联合盈灿咨询发布了《北上广地区P2P网贷行业2017年1月月报》。月报数据显示,截至2017年1月底,北京、上海、广东网贷平台数量总计1232家。 其中,北京市正常运营的网贷平台共有451家,较上月减少10家;上海市正常运营的网
阅读全文
摘要:多路资本争夺公募基金牌照 除了太平资产之外,险资今年对于公募牌照的渴望表现得淋漓尽致,此前有媒体报道中国太保有意从国泰君安证券公司手中受让国联安基金公司的部分股权。中国太保在随后的公告中承认确与国泰君安就该事项进行意向性接触,但截至公告发布时尚未达成实质性协议。 今年5月底华泰保险投资的华泰基金管理
阅读全文
摘要:delete delete delete
阅读全文
摘要:CENTOS7安装R语言环境 yum install texinfo.x86_64 yum install texlive.x86_64 cd /opt wget https://mirrors.tuna.tsinghua.edu.cn/CRAN/src/base/R-3/R-3.3.1.tar.g
阅读全文
摘要:mysql把一个表的字段update成另一个表的字段根据id 1.填充activity表里面的creator字段,用org的founderid,其中activity的orgid要和org的id对应,具体sql语句如下:update activity a inner join (select id,f
阅读全文
摘要:1月房地产企业销售TOP100出炉 万科重回第一 2017-02-05 07:40:32 来源:腾讯新闻 责任编辑: [摘要]TOP100房企1月的销售金额合计4311.8亿元,销售面积合计3648.1万平方米,环比2016年12月分别下降了19%和12% 点击图片进入下一页 点击图片进入下一页 新
阅读全文
摘要:别拿学历说事,这些天王中学没毕业,最低的是成龙 不八卦会死星人 01月30日 12:28 分类 :娱乐 阅读:3127 别拿学历说事,刘德华梁朝伟中学没毕业,最低的是成龙 俗话说:知识改变命运,但这里的知识指的并不是学历,娱乐圈就不乏学历低,但各方面都颇有建树的艺人 英雄莫问出处,今天小8就给大家开扒一下那些明星鲜为人知的学历 首先是天王刘德华,香港可立高中毕业 他的父亲是机...
阅读全文
摘要:私有云平台的时候,IT基础设施是自己的,一般位于企业内部。而采用公有云平台的时候,IT基础设施是位于一个第三方的数据中心。 私有云就是你自己的家,只有自己或者你允许的人能住,一般你不愿意外人知道的隐私都放在家里; 公有云就是收费景点,买了门票的都能进,隐私放这里可能会成为冠希; 混合云就是两者同时存
阅读全文
浙公网安备 33010602011771号