摘要:
SparkSQL数据清洗API 前面我们处理的数据实际上都是已经被处理好的规整数据,但是在大数据整个生产过程中,需要先对数据进行数据清洗,将杂乱无章的数据整理为符合后面处理要求的规整数据。 去重方法dropDuplicates 功能:对DF的数据进行去重,如果重复数据有多条,取第一条 缺失值处理dr 阅读全文
posted @ 2024-01-29 16:27
云云云云云云云云
阅读(28)
评论(0)
推荐(0)
2024年1月29日