摘要: spark sql 数据去重 在对spark sql 中的dataframe数据表去除重复数据的时候可以使用dropDuplicates()方法 dropDuplicates()有4个重载方法 第一个def dropDuplicates(): Dataset[T] = dropDuplicates( 阅读全文
posted @ 2020-08-25 11:30 JunCode 阅读(6207) 评论(0) 推荐(2)