薄荷柠檬茶

2020年3月22日

摘要：上一章我们简单介绍了一下Scala的数据结构，这一章我们将进行详细讲述。 1.数组：分为定长数组和变长数组定长数组：数组一旦声明，其长度是不可变的。定长数组的声明和访问：第一种：初始化定长度的数组：val 名称=new Array[数据类型](数组长度) 第二种：通过初始化数据构建数组：val 阅读全文

posted @ 2020-03-22 20:51 薄荷柠檬茶阅读(234) 评论(0) 推荐(0)

2020年3月15日

随机森林与Adaboost的区别

摘要：随机森林与Adaboost两者均归属于集成学习算法，随机森林是Bagging方法，Adaboost是Boosting方法。我们先来比较一下Boosting方法和Bagging方法的区别： 1.在样本选择上： Boosting每一轮的训练集是不变的，改变的只是每一个样本的权重； Bagging采用的阅读全文

posted @ 2020-03-15 19:16 薄荷柠檬茶阅读(2915) 评论(0) 推荐(0)

2020年3月8日

Spark性能调优

摘要：分配更多的资源：性能优化调优的王道，就是增加和分配更多的资源，这对于性能和速度上的提升是显而易见的。基本上，在一定范围之内，增加资源与性能的提升，是成正比的；写完了一个复杂的spark作业之后，进行性能调优的时候，首先第一步，就是要来调节最优的资源配置；在这个基础之上，如果说你的spark作阅读全文

posted @ 2020-03-08 15:18 薄荷柠檬茶阅读(489) 评论(0) 推荐(0)

2020年2月29日

关于Scala的知识点（一）

摘要： Scala的概念： Scala是一个面向对象和面向函数式的多范式编程语言，基于JVM，运行于Java虚拟机，兼容现有Java程序。在Scala编程中，“每个值都是对象，每个符号都是方法操作”。在面向函数中，函数是一个对象。他跟字符串、数值具有同等地位，也就是说函数可以赋值给一个变量，可以作为方法阅读全文

posted @ 2020-02-29 21:56 薄荷柠檬茶阅读(367) 评论(0) 推荐(0)

公告