摘要: 快速了解dataframe 提供的功能. 避免重复工作 版本 spark 2.2 相关性 cov 皮尔逊相关系数 corr 方差 删除 dropDuplicates 可指定列 dropna 可指定列 选择 select selectExpr 支持 sql 表达式的select colRegex 正则 阅读全文
posted @ 2019-03-27 22:33 bugfree 阅读(1242) 评论(0) 推荐(0)