摘要: DataFrame由record序列组成,record的类型是Row类型。 columns代表者计算表达式可以在独立的record上运行。 Schema定义了各列的名称和数据类型。 分区定义了DataFrame和DataSet在集群上的物理分配。 Schemas 可以让数据源定义Schema(又叫做 阅读全文
posted @ 2019-02-14 16:58 DataNerd 阅读(403) 评论(0) 推荐(0)