摘要: 核心提示:swagger在很长一段时间不访问之后,再访问会出现下面这个(猜测是session过期),如果不做任何处理,这个页面会频繁访问:http://xxx.xxx.com/null/swagger-resources/configuration/ui,因为是死循环,访问量能把服务撑爆了。可以看到 阅读全文
posted @ 2021-06-27 16:13 张先森- 阅读(3174) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/xiaolongs/p/14854158.html 04 - RDD编程练习 原因 :晚上学习python错过了提交时间 https://www.cnblogs.com/xiaolongs/p/14854164.html 05 - RDD练习:词频统计 阅读全文
posted @ 2021-06-05 23:42 张先森- 阅读(54) 评论(0) 推荐(0) 编辑
摘要: 07 从RDD创建DataFrame 1.pandas df 与 spark df的相互转换 df_s=spark.createDataFrame(df_p) df_p=df_s.toPandas() 2. Spark与Pandas中DataFrame对比 Pandas Spark 工作方式 单机s 阅读全文
posted @ 2021-06-05 23:19 张先森- 阅读(67) 评论(0) 推荐(0) 编辑
摘要: RDD练习:词频统计 一、词频统计: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words flatmap() 3.全部转换为小写 lower() 4.去掉长度小于3的单词 filter() 5.去掉停用词 6.转换成键值对 map() 7.统计词频 reduceByKe 阅读全文
posted @ 2021-06-05 23:16 张先森- 阅读(44) 评论(0) 推荐(0) 编辑
摘要: RDD编程练习 一、filter,map,flatmap练习: 1.读文本文件生成RDD lines 2.将一行一行的文本分割成单词 words 3.全部转换为小写 4.去掉长度小于3的单词 5.去掉停用词 6.练习一的生成单词键值对 最后相关文件已经保存。 阅读全文
posted @ 2021-06-05 23:15 张先森- 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 1.安装启动检查Mysql服务。netstat -tunlp (3306) 2.spark 连接mysql驱动程序。–cp /usr/local/hive/lib/mysql-connector-java-5.1.40-bin.jar /usr/local/spark/jars 3.启动 Mysql 阅读全文
posted @ 2021-05-29 13:24 张先森- 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 08 学生课程分数的Spark SQL分析 读学生课程分数文件chapter4-data01.txt,创建DataFrame。 一、用DataFrame的操作完成以下数据分析要求 每个分数+5分。 总共有多少学生? 总共开设了哪些课程? 每个学生选修了多少门课? 每门课程有多少个学生选? 每门课程大 阅读全文
posted @ 2021-05-26 16:35 张先森- 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 06 Spark SQL 及其DataFrame的基本操作 1.Spark SQL出现的 原因是什么? Spark为结构化数据处理引入了一个称为Spark SQL的编程模块。简而言之,sparkSQL是Spark的前身,是在Hadoop发展过程中,为了给熟悉RDBMS但又不理解MapReduce的技 阅读全文
posted @ 2021-05-08 22:48 张先森- 阅读(39) 评论(0) 推荐(0) 编辑
摘要: 07 Spark RDD编程 综合实例 英文词频统计 1. 结果 2. 并比较不同计算框架下编程的优缺点、适用的场景。 –Python –MapReduce –Hive –Spark Mapreduce,它最本质的两个过程就是Map和Reduce,Map的应用在于我们需要数据一对一的元素的映射转换, 阅读全文
posted @ 2021-04-22 20:58 张先森- 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 总共有多少学生?map(), distinct(), count() 开设了多少门课程? 每个学生选修了多少门课?map().countByValue() //map(), countByKey() 每门课程有多少个学生选?map(), countByValue() Tom选修了几门课?每门课多少分 阅读全文
posted @ 2021-04-12 20:06 张先森- 阅读(42) 评论(0) 推荐(0) 编辑