10 2018 档案

摘要:有时候我们在拿到原始数据的时候,我们不能直接使用。大概场景有下面这些,我遇到的 1. 数字比较大,容易爆计算量,更不容易收敛 2. 比如房子价格这种变量,并不是正态分布,有时候不利于我们做一些和正态分布有关系的线性模型分析, 那这个时候,我们可能需要对数据做一些预处理的工作。 数据的标准化(norm 阅读全文
posted @ 2018-10-28 22:09 深度预习 阅读(13561) 评论(1) 推荐(2)
摘要:Shapefile文件是美国ESRI公司发布的文件格式,因其ArcGIS软件的推广而得到了普遍的使用,是现在GIS领域使用最为广泛的矢量数据格式。官方称Shapefile是一种用于存储地理要素的几何位置和属性信息的非拓扑简单格式。 一般地,Shapefile文件是多个文件的集合,至少包括一个shp, 阅读全文
posted @ 2018-10-27 17:34 深度预习 阅读(4909) 评论(0) 推荐(0)
摘要:1. 基本概念 1.1 ROC与AUC ROC曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,ROC曲线称为受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivi 阅读全文
posted @ 2018-10-13 19:22 深度预习 阅读(1610) 评论(0) 推荐(0)