摘要: 上一章我们简单介绍了一下Scala的数据结构,这一章我们将进行详细讲述。 1.数组:分为定长数组和变长数组 定长数组:数组一旦声明,其长度是不可变的。 定长数组的声明和访问: 第一种:初始化定长度的数组:val 名称=new Array[数据类型](数组长度) 第二种:通过初始化数据构建数组:val 阅读全文
posted @ 2020-03-22 20:51 薄荷柠檬茶 阅读(231) 评论(0) 推荐(0)
摘要: 随机森林与Adaboost两者均归属于集成学习算法,随机森林是Bagging方法,Adaboost是Boosting方法。 我们先来比较一下Boosting方法和Bagging方法的区别: 1.在样本选择上: Boosting每一轮的训练集是不变的,改变的只是每一个样本的权重; Bagging采用的 阅读全文
posted @ 2020-03-15 19:16 薄荷柠檬茶 阅读(2875) 评论(0) 推荐(0)
摘要: 分配更多的资源: 性能优化调优的王道,就是增加和分配更多的资源,这对于性能和速度上的提升是显而易见的。 基本上,在一定范围之内,增加资源与性能的提升,是成正比的; 写完了一个复杂的spark作业之后,进行性能调优的时候,首先第一步,就是要来调节最优的资源配置; 在这个基础之上,如果说你的spark作 阅读全文
posted @ 2020-03-08 15:18 薄荷柠檬茶 阅读(479) 评论(0) 推荐(0)
摘要: Scala的概念: Scala是一个面向对象和面向函数式的多范式编程语言,基于JVM,运行于Java虚拟机,兼容现有Java程序。 在Scala编程中,“每个值都是对象,每个符号都是方法操作”。 在面向函数中,函数是一个对象。他跟字符串、数值具有同等地位,也就是说函数可以赋值给一个变量,可以作为方法 阅读全文
posted @ 2020-02-29 21:56 薄荷柠檬茶 阅读(360) 评论(0) 推荐(0)