会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
PEAR2020
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
19
20
21
22
23
24
25
26
27
···
30
下一页
2020年10月12日
spark Graphx 之 Connected Components
摘要: 一、Connected Components算法 Connected Components即连通体算法用id标注图中每个连通体,将连通体中序号最小的顶点的id作为连通体的id。如果在图G中,任意2个顶点之间都存在路径,那么称G为连通图,否则称该图为非连通图,则其中的极大连通子图称为连通体,如下图所示
阅读全文
posted @ 2020-10-12 11:48 PEAR2020
阅读(784)
评论(0)
推荐(0)
2020年10月11日
spark Graphx 之 Pregel
摘要: Pregel是Google提出的用于大规模分布式图计算框架 图遍历(BFS) 单源最短路径(SSSP) PageRank计算 Pregel的计算由一系列迭代组成,称为supersteps Pregel迭代过程 每个顶点从上一个superstep接收入站消息 计算顶点新的属性值 在下一个superst
阅读全文
posted @ 2020-10-11 16:52 PEAR2020
阅读(259)
评论(0)
推荐(0)
2020年10月10日
spark Graphx 之 PageRank
摘要: PageRank(PR)算法 用于评估网页链接的质量和数量,以确定该网页的重要性和权威性的相对分数,范围为0到10 从本质上讲,PageRank是找出图中顶点(网页链接)的重要性 GraphX提供了PageRank API用于计算图的PageRank 使用方法: graph.pageRank(0.0
阅读全文
posted @ 2020-10-10 20:23 PEAR2020
阅读(719)
评论(0)
推荐(0)
Spark RDD之 sortBy如何全局排序?
摘要: import org.apache.spark.sql.SparkSession import scala.util.Random object TestSortBy { def main(args: Array[String]): Unit = { val spark = SparkSession
阅读全文
posted @ 2020-10-10 14:20 PEAR2020
阅读(2839)
评论(0)
推荐(0)
spark Graphx 之 应用: 谁是网络红人?
摘要: 一、数据:user和各自粉丝的关系 ((User47,86566510),(User83,15647839)) ((User47,86566510),(User83,15647839)) ((User47,86566510),(User83,15647839)) ((User47,86566510)
阅读全文
posted @ 2020-10-10 14:19 PEAR2020
阅读(181)
评论(0)
推荐(0)
Cannot resolve plugin org.apache.maven.plugins:maven-site-plugin:3.3「单独爆红」
摘要: 问题原因:问题是使用自己的maven操作不规范造成的。 解决方法:更改为标准目录结构 (1)、添加目录repository和复制settings.xml文件 (2)、更改IDEA内的setting设置 (3)、成功后:
阅读全文
posted @ 2020-10-10 12:30 PEAR2020
阅读(6317)
评论(2)
推荐(1)
2020年10月8日
spark Graphx 之 基础操作
摘要: https://www.bookstack.cn/read/spark-graphx-source-analysis/vertex-edge-triple.md 一、基本操作 1,当顶点和边的属性全都具备,直接构建Graph import org.apache.spark.graphx.{Edge,
阅读全文
posted @ 2020-10-08 14:56 PEAR2020
阅读(519)
评论(0)
推荐(0)
2020年10月6日
scala之 spark连接SQL和HIVE/IDEA操作HDFS
摘要: 一、连接SQL 方法一、 package com.njbdqn.linkSql import java.util.Properties import org.apache.spark.sql.SparkSession import org.apache.spark.sql._ object Link
阅读全文
posted @ 2020-10-06 11:24 PEAR2020
阅读(1289)
评论(0)
推荐(0)
hive之 连接DBeaver
摘要: hive-jdbc的jar包直接从hive/中找
阅读全文
posted @ 2020-10-06 11:14 PEAR2020
阅读(162)
评论(0)
推荐(0)
hive之 配置的图解
摘要: 以下详见:https://blog.csdn.net/weixin_48833605/article/details/111124191 一、metastore 二、hiveserver2
阅读全文
posted @ 2020-10-06 11:07 PEAR2020
阅读(158)
评论(0)
推荐(0)
上一页
1
···
19
20
21
22
23
24
25
26
27
···
30
下一页
公告