摘要:
一、机器学习工作流概念 1.DataFrame 使用Spark SQL中的DataFrame作为数据集,它可以容纳各种数据类型。较之RDD,DataFrame包含了schema 信息,更类似传统数据库中的二维表格。 它被ML Pipeline用来存储源数据。例如,DataFrame中的列可以是存储的 阅读全文
posted @ 2019-12-15 16:33
nxf_rabbit75
阅读(1095)
评论(0)
推荐(0)