随笔分类 -  大数据

大数据框架的使用经验,包括spark框架、Kafka。
摘要:检索数据 排序检索数据 过滤数据 使用通配符过滤 使用正则表达式进行搜索 创建计算字段 使用数据处理函数 汇总数据 分组数据 使用子查询 联结表 创建高级联结 组合查询 全文本搜索 插入数据 更新和删除数据 创建和操纵表 使用视图 使用存储过程 使用游标 使用触发器 管理事务处理 全球化和本地化 阅读全文
posted @ 2020-04-28 22:38 justisme 阅读(634) 评论(0) 推荐(0)
摘要:Spark Core RDD以及Pair RDD的常用算子 Spark SQL RDD转换为DataFrame DataFrame与MySQL的交互 Spark MLlib 流水线pipeline的基本用法 决策树 K均值 K-means 逻辑回归 LogisticRegression 超参优化 网格搜索 Spark Streaming spark书籍(电子版、可直接下载) 阅读全文
posted @ 2020-04-19 13:29 justisme 阅读(492) 评论(0) 推荐(0)