随笔分类 - 大数据
大数据框架的使用经验,包括spark框架、Kafka。
摘要:检索数据
排序检索数据
过滤数据
使用通配符过滤
使用正则表达式进行搜索
创建计算字段
使用数据处理函数
汇总数据
分组数据
使用子查询
联结表
创建高级联结
组合查询
全文本搜索
插入数据
更新和删除数据
创建和操纵表
使用视图
使用存储过程
使用游标
使用触发器
管理事务处理
全球化和本地化
阅读全文
摘要:Spark Core
RDD以及Pair RDD的常用算子
Spark SQL
RDD转换为DataFrame
DataFrame与MySQL的交互
Spark MLlib
流水线pipeline的基本用法
决策树
K均值 K-means
逻辑回归 LogisticRegression
超参优化 网格搜索
Spark Streaming
spark书籍(电子版、可直接下载)
阅读全文

浙公网安备 33010602011771号