spark ml
摘要:
spark ml是基于spark 2.0环境,以DataFrame为数据处理单元。spark经历了三代,依次如下。DataFrame是个列式数据集,结构化的数据集,RDD是非结构化的,第二代比第一代因结构化数据计算的性能都要优秀些。第三代的dataset已经序列化的 数据,是encoding,已经转 阅读全文
posted @ 2019-11-26 13:30 chenglanfighting 阅读(642) 评论(0) 推荐(0)
浙公网安备 33010602011771号