01 2019 档案

摘要:多分类问题优先选择SVM,随机森林,其次是逻辑回归。 朴素贝叶斯和线性回归都是比较简单的模型,对于数据的要求比较高,功能不是特别强大。 1、决策树 不需要对数据做任何预处理, 2、随机森林 3、数据预处理与特征工程 (1)数据预处理:只需要X 数据无量钢化:标准化(转化为正态分布)、归一化(不改变数 阅读全文
posted @ 2019-01-13 15:08 simpleDi 阅读(1652) 评论(0) 推荐(0)
摘要:处理样本不均衡数据一般可以有以下方法: 1、人为将样本变为均衡数据。 上采样:重复采样样本量少的部分,以数据量多的一方的样本数量为标准,把样本数量较少的类的样本数量生成和样本数量多的一方相同。 下采样:减少采样样本量多的部分,以数据量少的一方的样本数量为标准。 2、调节模型参数(class_weig 阅读全文
posted @ 2019-01-07 21:52 simpleDi 阅读(3114) 评论(1) 推荐(0)
摘要:参考文献:https://blog.csdn.net/Dominic_S/article/details/83002153 1.硬间隔最大化 对于以上的KKT条件可以看出,对于任意的训练样本总有ai=0或者yif(xi) - 1=0即yif(xi) = 11)当ai=0时,代入最终的模型可得:f(x 阅读全文
posted @ 2019-01-06 21:38 simpleDi 阅读(4918) 评论(0) 推荐(0)
摘要:1、什么是评分卡? 在银行借贷场景中,评分卡是一种以分数形式来衡量一个客户的信用风险大小的手段,一般来说,评分卡打出的分数越高,客户的信用越好,风险越小。 2、评分卡怎么使用? 对于需要借贷的个人或者公司,在借贷时需要填写一张表格,表格内容包括年龄,收入,家庭人口数量等等。评分卡将每个特征划分为几个 阅读全文
posted @ 2019-01-06 11:02 simpleDi 阅读(5129) 评论(0) 推荐(0)
摘要:参考文献:https://www.cnblogs.com/rwh871212/p/6955489.html 老师接了一个新项目,需要团队共同完成开发任务,因此需要SVN。SVN是C/S架构: 1、服务器端安装VisualSVN server: 其中location是安装目录;repository是版 阅读全文
posted @ 2019-01-03 16:20 simpleDi 阅读(756) 评论(0) 推荐(0)
摘要:1、使用交换机或者路由器将几台电脑组成一个局域网(互相之间能ping通即可) 2、在需要共享的文件夹右键、属性、共享。 3、点击“共享”按钮,可以选择“everyone”,点击“添加”按钮,并且可以设备权限为“只读”或者“可读可写”两种方式 4、点击下方的“网络和共享中心”,在“所有网络”的“密码保 阅读全文
posted @ 2019-01-03 15:31 simpleDi 阅读(913) 评论(0) 推荐(0)
摘要:1、通过navicat通过需要连接的Ip,用户名、密码即可连接远程数据库,并且可以用eclipse访问数据库 2、通过远程连接服务器桌面,可以访问远程服务器,使用导出助手将表导出为dbf格式,并保存文件至本地: 3、另外,怎样让一台计算机可以被其他机器远程访问呢? 右键我的电脑->属性->远程桌面- 阅读全文
posted @ 2019-01-03 13:26 simpleDi 阅读(2049) 评论(0) 推荐(0)