我觉得我还能挣扎一下

[置顶] JDK与scala的版本兼容对应问题

摘要： Failed to initialize compiler: object java.lang.Object in compiler mirror not found. 2 ** Note that as of 2.8 scala does not assume use of the java classpath. 3 ** For the old behavior pass -usejavacp to scala, or if using a Settings 4 ** object programmatically, settings.usejavacp.value = true. 阅读全文

posted @ 2020-11-25 16:55 我觉得我还能挣扎一下阅读(8966) 评论(0) 推荐(0)

Spark性能优化指南——高级篇

摘要：前言继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后，本文作为《Spark性能优化指南》的高级篇，将深入分析数据倾斜调优与shuffle调优，以解决更加棘手的性能问题。数据倾斜调优调优概述有的时候，我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜，此时Spark作阅读全文

posted @ 2022-05-18 00:14 我觉得我还能挣扎一下阅读(87) 评论(0) 推荐(0)

Zookeeper安装单机模式

摘要：下载地址：http://archive.apache.org/dist/zookeeper/ 上传到linux并解压 [root@linux01 software]# tar -zxvf zookeeper-3.4.14.tar.gz 修改zookeeper文件夹中zoo_sample.cfg 改名阅读全文

posted @ 2022-03-31 15:55 我觉得我还能挣扎一下阅读(41) 评论(0) 推荐(0)

spark安装

摘要： spark的安装 1. 下载并解压在官网：https://archive.apache.org/dist/spark/ 下载所需版本的 spark，这里我下载的版本为2.3.1,下载后进行解压（Linux文件类型：*.tar.gz和*.tgz 用 tar –xzf 解压）： 1 [root@lin 阅读全文

posted @ 2022-03-22 00:51 我觉得我还能挣扎一下阅读(215) 评论(0) 推荐(0)

安装JDK，免密钥，集群Hadoop

摘要：一、linux下JDK的安装 1. 下载并解压在官网下载所需版本的 JDK，这里我下载的版本为JDK 1.8 ,下载后进行解压： 1 [root@linux01 ~]# tar -zxvf jdk-8u321-linux-x64.tar.gz 2. 设置环境变量 1 [root@linux01 阅读全文

posted @ 2022-03-19 22:40 我觉得我还能挣扎一下阅读(94) 评论(0) 推荐(0)

Spark中文乱码

摘要：本地读取中文文本，中文乱码阅读全文

posted @ 2021-09-05 10:07 我觉得我还能挣扎一下阅读(1859) 评论(0) 推荐(0)

IDEA中---错误: 无法初始化主类原因: java.lang.NoClassDefFoundError: org/apache/spark/sql/SQLContext

摘要： NoClassDefFoundError: org/apache/spark/sql/SQLContext 阅读全文

posted @ 2021-09-03 23:14 我觉得我还能挣扎一下阅读(2261) 评论(0) 推荐(0)

又是版本问题，报错：Exception in thread "main" java.lang.NoSuchMethodError: scala.Product.$init$(Lscala/Product;)V

摘要：使用IDEA工具运行Spark的WordCount时，运行报错，报错信息如下 Exception in thread "main" java.lang.NoSuchMethodError: scala.Product.$init$(Lscala/Product;)V at org.apache.sp 阅读全文

posted @ 2021-07-03 11:57 我觉得我还能挣扎一下阅读(2562) 评论(0) 推荐(0)

代理模式：静态代理与动态代理

摘要：代理模式：优点：用户只需要知道具体工厂的名称就可得到所要的产品，无须知道产品的具体创建过程。灵活性增强，对于新产品的创建，只需多写一个相应的工厂类。典型的解耦框架。高层模块只需要知道产品的抽象类，无须关心其他实现类，满足迪米特法则、依赖倒置原则和里氏替换原则。缺点：类的个数容易过多，增加阅读全文

posted @ 2021-02-05 00:02 我觉得我还能挣扎一下阅读(130) 评论(0) 推荐(0)

1、DataFrame、Dataset、SparkSession

摘要：一，介绍，对比与发展：Dataframe，Dataset DataFrame：是较早用于管理结构化数据的数据类型，在Spark 2.0版本之前，是分析结构化数据的主角 DataFrame将数据通过Schema模式组织到一个二维表格中（就像关系型数据库的表一样），每一列数据都存在列名。在数据分析时，阅读全文

posted @ 2020-12-21 17:42 我觉得我还能挣扎一下阅读(251) 评论(0) 推荐(0)

VMware安装Linux

摘要：安装Linux系统详细步骤：前置条件：（1）下载并安装好VMware，（2）下载CentSO镜像详细步骤：一，定义一台虚拟机： 1，点击创建新的虚拟机（或点击文件file=》创建虚拟机） 2.您需希望使用什么类型的配置：选择第二项“自定义（高级）”，点击下一步 3.选择虚拟机的兼容性：不修改，阅读全文

posted @ 2020-11-28 17:59 我觉得我还能挣扎一下阅读(110) 评论(0) 推荐(0)

导航

2022年5月18日

2022年3月31日

2022年3月22日

2022年3月19日

2021年9月5日

2021年9月3日

2021年7月3日

2021年2月5日

2020年12月21日

2020年11月28日