2019年9月3日

摘要: 一、导论 统计应用领域:企业发展战略、产品质量管理、市场研究、财务分析、经济预测、人力资源管理。 统计数据的分类:按计量尺度:分类数据、顺序数据、数值型数据(★) 按收集方法:观测数据、实验数据 按时间状况:截面数据、时间序列数据 二、数据的搜集 数据来源:调查或实验 调查方法分类:概率抽样:简单随 阅读全文
posted @ 2019-09-03 13:07 数分小白小姐姐 阅读(1598) 评论(0) 推荐(1) 编辑

2019年9月2日

摘要: 一般字符:. 匹配任意单个字符(不包括换行符) \ 转义字符(把有特殊含义的字符转换成字面意思) [...] 字符集(对应字符集中的任意字符) [a-z]所有字母、[0-9]所有数字、[\u4e00-\u9fa5]所有中文 预定义字符集:\d 匹配一个数字字符,等价于[0-9] \D 匹配一个非数字 阅读全文
posted @ 2019-09-02 17:35 数分小白小姐姐 阅读(126) 评论(0) 推荐(0) 编辑

2019年8月26日

摘要: Numpy 的核心是 ndarray 对象,这个对象封装了同质数据类型的n维数组。(数组,即为有序的元素序列) numpy约定俗成的导入方式: import numpy as np 基本的 ndarray 是使用 NumPy 中的数组函数创建的,如下所示: array(object, dtype=N 阅读全文
posted @ 2019-08-26 16:06 数分小白小姐姐 阅读(302) 评论(0) 推荐(0) 编辑

2019年7月24日

摘要: from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = "all" 阅读全文
posted @ 2019-07-24 14:30 数分小白小姐姐 阅读(805) 评论(0) 推荐(0) 编辑

2019年7月2日

摘要: 评分卡常用模型与算法(应用了解模型,原理了解算法) 模型:逻辑回归模型、决策树模型、神经网络模型、模型融合 算法:MLE、Gradient Descent、RF、GBDT、XGboost、LGBM、BP算法、Stacking、Blending 信用风险评分卡全流程: 一、模型设计 业务理解:进一步理 阅读全文
posted @ 2019-07-02 21:51 数分小白小姐姐 阅读(1468) 评论(0) 推荐(0) 编辑

2019年6月30日

摘要: 特征工程: 一、分类特征:用分类特征映射关系编码成整数 独热编码和稀疏矩阵 二、文本特征:将文本转换成一组数值 单词统计、TF-IDF词频逆文档频率 三、图像特征:用像素表示图像 四、衍生特征:基函数回归(多项式特征) 五、缺失值填充 均值、中位数、众数、矩阵填充 六、特征管道 from sklea 阅读全文
posted @ 2019-06-30 12:18 数分小白小姐姐 阅读(140) 评论(0) 推荐(0) 编辑

2019年6月26日

摘要: 1.sigmoid函数: 逻辑回归与线性回归的联系函数 将z压缩为g(z),在(0,1)之间,0.5以上归1类,0.5以下归0类 2.逻辑回归特点:对线性关系拟合效果好,计算快,分类结果不是固定的0和1,而是以小数形式呈现的类概率数字。 3.求解损失函数:极大似然估计 4.防止过拟合:L1正则化 L 阅读全文
posted @ 2019-06-26 08:19 数分小白小姐姐 阅读(145) 评论(0) 推荐(0) 编辑

2019年6月25日

摘要: 1.多元线性回归方程: 2.模型: (KNN、K-Means没有模型) 3.损失函数:衡量系数w的模型拟合训练集时产生的信息损失的大小,以此衡量w优劣。 追求让损失函数最小化的参数组合,即 4.L2范式形式的损失函数:SSE误差平方和/RSS残差平方和 5.最小二乘法:通过最小化真实值和预测值之间的 阅读全文
posted @ 2019-06-25 15:10 数分小白小姐姐 阅读(478) 评论(0) 推荐(0) 编辑

2019年6月24日

摘要: 在调参的时候,可以参考这个顺序 阅读全文
posted @ 2019-06-24 11:37 数分小白小姐姐 阅读(1347) 评论(1) 推荐(1) 编辑

2019年6月23日

摘要: 1.集成学习:将若干个弱分类器通过一定的策略组合之后产生一个强分类器。 装袋法bagging:多个相互独立的评估器,有放回的随机抽样。代表:随机森林 提升法boosting:赋予权重,每一轮结束时自动调整权重。 stacking 2.组合策略:平均法(数值类回归常用)、投票法、学习法(stackin 阅读全文
posted @ 2019-06-23 22:03 数分小白小姐姐 阅读(531) 评论(0) 推荐(0) 编辑