上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 45 下一页
摘要: 开发中遇到需求:合并两个Map集合对象(将两个对应Key的值累加) 先说解决方案: 首先: Scala中现有的合并集合操作不能满足这个需求 。 注意合并后的结果a的G02的值其实是被覆盖掉了。。 然后: 说说那个表达式中(a /: b)( ... ) 这部分是什么鬼。这个其实是scala简化的fol 阅读全文
posted @ 2019-03-30 11:52 大葱拌豆腐 阅读(466) 评论(0) 推荐(0)
摘要: 除了逐行处理数据的udf,还有比较常见的就是聚合多行处理udaf,自定义聚合函数。类比rdd编程就是map和reduce算子的区别。 自定义UDAF,需要extends org.apache.spark.sql.expressions.UserDefinedAggregateFunction,并实现 阅读全文
posted @ 2019-03-30 11:38 大葱拌豆腐 阅读(1426) 评论(0) 推荐(0)
摘要: Spark Streaming可以用于实时流项目的开发,实时流项目的数据源除了可以来源于日志、文件、网络端口等,常常也有这种需求,那就是实时分析处理MySQL中的增量数据。面对这种需求当然我们可以通过JDBC的方式定时查询Mysql,然后再对查询到的数据进行处理也能得到预期的结果,但是Mysql往往 阅读全文
posted @ 2019-03-29 22:41 大葱拌豆腐 阅读(4284) 评论(1) 推荐(2)
摘要: 本文内容和代码是接着上篇文章来写的,推荐先看一下哈~ 我们上一篇文章是写了电影推荐的实现,但是推荐内容是否合理呢,这就需要我们对模型进行评估 针对推荐模型,这里根据 均方差 和 K值平均准确率 来对模型进行评估,MLlib也对这几种评估方法都有提供内置的函数 在真实情况下,是要不断地对推荐模型的三个 阅读全文
posted @ 2019-03-29 18:14 大葱拌豆腐 阅读(1490) 评论(0) 推荐(0)
摘要: 本文将使用 SparkML 来构建推荐引擎。 推荐引擎算法大致分为 基于内容的过滤、协同过滤、矩阵分解,本文将使用基于属于矩阵分解的 最小二乘法 算法来构建推荐引擎。 对于推荐引擎模块这里将分为两篇文章,第一篇文章主要是以实现推荐功能为主,第二篇文章主要是对模型进行评估 文章将按照以下章节来进行书写 阅读全文
posted @ 2019-03-29 17:36 大葱拌豆腐 阅读(852) 评论(0) 推荐(0)
摘要: 转载来自: https://blog.csdn.net/qq_40990732/article/details/80914873 https://blog.csdn.net/tp15868352616/article/details/80891057 相关概念 1.Metadata概念: 元数据包含 阅读全文
posted @ 2019-03-29 15:37 大葱拌豆腐 阅读(4202) 评论(0) 推荐(0)
摘要: 在hive中有metaServer与hiveServer2两种服务,看了好多文章说这两个的区别,文章内容有对有错,不够全面,故在这里好好总结一下。 首先,下面这个hive构架图,我们一定不陌生,它反应出hive有哪些组件结构 当然下面的图是hadoop1的部分,现在JobTracker是Yarn了 阅读全文
posted @ 2019-03-29 15:26 大葱拌豆腐 阅读(3618) 评论(0) 推荐(0)
摘要: 转载自:https://blog.csdn.net/Android_xue/article/details/79780463 Spark两种共享变量:广播变量(broadcast variable)与累加器(accumulator) 累加器用来对信息进行聚合,而广播变量用来高效分发较大的对象。 共享 阅读全文
posted @ 2019-03-25 20:40 大葱拌豆腐 阅读(1363) 评论(0) 推荐(0)
摘要: import org.apache.spark.ml.Pipelineimport org.apache.spark.ml.classification.MultilayerPerceptronClassifierimport org.apache.spark.ml.evaluation.Multi 阅读全文
posted @ 2019-03-25 17:19 大葱拌豆腐 阅读(715) 评论(0) 推荐(0)
摘要: 流处理主要有3种应用场景:无状态操作、window操作、状态操作。 reduceByKeyAndWindow countByValueAndWindow countByValueAndWindow的源码如下所示: reduceByWindow reduceByWindow的源码如下所示: count 阅读全文
posted @ 2019-03-25 16:19 大葱拌豆腐 阅读(2749) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 45 下一页