文章分类 -  数据处理

摘要:因为sas处理的数据多是关系表,所以随时要保持行和列的概念 ♦行处理:①数据筛选 ②排序/求秩 ③抽样 ④数据分组和汇总 ♦列处理 ①计算新变量 ②拆分列 ③堆叠列 ④转置列 ⑤对列的重编码 ⑥标准化 阅读全文
posted @ 2019-12-30 15:45 虾米WD 阅读(85) 评论(0) 推荐(0)
摘要:数据清理: ①缺失值: ♦忽略观测值; ♦人工填写; ♦使用全局变量填写; ♦使用属性的中心度量; ♦单独作为一类; ②异常值识别: ♦简单的探索性分析(频数<10%,或在M±3sgm); ♦不符合特定函数形式的模型; ♦聚类算法中只包含较小数量的观测值的群; ♦箱式图; ③无效值 ④数据的重复值 阅读全文
posted @ 2019-12-30 11:04 虾米WD 阅读(106) 评论(0) 推荐(0)