随笔档案「2021年6月14日」：Pandas之groupby分组 ... - Convict

2021年6月14日

摘要：释义 groupby用来分组，调用groupby 之后返回pandas.core.groupby.generic.DataFrameGroupBy，其实就是由一个个格式为(key, 分组后的dataframe)的元组，组成的列表： [(key1, dataframe1), (key2, datafr 阅读全文

posted @ 2021-06-14 18:52 Convict 阅读(396) 评论(0) 推荐(0)

Pandas之isna，fillna

摘要： isna() 释义筛选为NaN的布尔值，可接受单个标量或者数组举例筛选stu_name为NaN的所有行： df = pd.DataFrame({'stu_name': ['Tom', 'Tony', 'Jack', 'Jack', np.nan], 'stu_age': [16, 16, 15 阅读全文

posted @ 2021-06-14 18:11 Convict 阅读(402) 评论(0) 推荐(0)

Spark算子 - groupByKey

摘要：释义根据RDD中的某个属性进行分组，分组后形式为(k, [v1, v2, ...]) 方法签名如下： def groupByKey(): RDD[(K, Iterable[V])] = self.withScope { ... } 案例查看每个科目有哪些学生选择 object TestGroup 阅读全文

posted @ 2021-06-14 13:59 Convict 阅读(184) 评论(0) 推荐(0)

Spark算子 - groupBy

摘要：释义根据RDD中的某个属性进行分组，分组后形式为(k, [(k, v1), (k, v2), ...])，即groupBy 后组内元素会保留key值方法签名如下： def groupBy[K](f: T => K)(implicit kt: ClassTag[K]): RDD[(K, Itera 阅读全文

posted @ 2021-06-14 13:25 Convict 阅读(1271) 评论(0) 推荐(0)

Loading

康威特冶楼

公告