摘要:
1、去重distinct 2、抽样 3、返回最高记录top_n 4、筛选 5、select子集 选择以某些字符串开头的列 同样的用法有:ends_with(‘id’),contains(‘date’) 6、arrange排序 7、敲黑板:summarize 阅读全文
posted @ 2017-07-13 16:42
积水成渊数据分析
阅读(571)
评论(0)
推荐(0)
摘要:
一、数据变换 中心化、标准化原数据: log变换: apply 既能对行操作,又能对列操作,lapply不需要指定行列,默认对列进行操作 age income store_exp1 4.043051 11.70324 6.2712422 4.143135 11.71184 6.1696233 4.0 阅读全文
posted @ 2017-07-13 13:05
积水成渊数据分析
阅读(435)
评论(0)
推荐(0)

浙公网安备 33010602011771号