打赏
摘要: 不多说,直接上干货! Apache Atlas是Hadoop社区为解决Hadoop生态系统的元数据治理问题而产生的开源项目,它为Hadoop集群提供了包括数据分类、集中策略引擎、数据血缘、安全和生命周期管理在内的元数据治理核心能力。 http://www.jianshu.com/p/4eee91bc 阅读全文
posted @ 2017-08-31 18:48 大数据和AI躺过的坑 阅读(8662) 评论(1) 推荐(0) 编辑
摘要: 不多说,直接上干货! 第一步:卸载CentOS中自带openjdk Centos 6.5下的OPENJDK卸载和SUN的JDK安装、环境变量配置 第二步:安装Intellij IDEA 若是3节点如,master、slave1、slave2,则建议将其安装在master节点上 到https://ww 阅读全文
posted @ 2017-08-31 17:57 大数据和AI躺过的坑 阅读(1320) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! spark-1.6.1-bin-hadoop2.6里Basic包下的JavaPageRank.java 没结果,暂时 spark-2.2.0-bin-hadoop2.6里Basic包下的JavaPageRank.java 没结果,暂时 阅读全文
posted @ 2017-08-31 15:09 大数据和AI躺过的坑 阅读(479) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! spark-1.6.1-bin-hadoop2.6里Basic包下的SparkPageRank.scala 暂时还没运行出结果、 spark-2.2.0-bin-hadoop2.6里Basic包下的SparkPageRank.scala 阅读全文
posted @ 2017-08-31 14:43 大数据和AI躺过的坑 阅读(1102) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! spark-1.6.1-bin-hadoop2.6里Basic包下的JavaTC.java spark-2.2.0-bin-hadoop2.6里Basic包下的JavaTC.java 阅读全文
posted @ 2017-08-31 12:44 大数据和AI躺过的坑 阅读(396) 评论(0) 推荐(0) 编辑
摘要: 不多说,直接上干货! 前言 其实啊,无论你是初学者还是具备了有一定spark编程经验,都需要对spark源码足够重视起来。 本人,肺腑之己见,想要成为大数据的大牛和顶尖专家,多结合源码和操练编程。 好一段时间之前,写过这篇博客 使用 IntelliJ IDEA 导入 Spark 最新源码及编译 Sp 阅读全文
posted @ 2017-08-31 11:16 大数据和AI躺过的坑 阅读(3553) 评论(0) 推荐(2) 编辑
摘要: 不多说,直接上干货! spark-1.6.1-bin-hadoop2.6里Basic包下的SparkTC.scala 阅读全文
posted @ 2017-08-31 11:04 大数据和AI躺过的坑 阅读(414) 评论(0) 推荐(0) 编辑