随笔分类 - 大数据笔面试整理
摘要:求每位同学考试成绩90分以上的优秀率 SELECT student_id,ROUND(AVG(score>90),2) FROM `score` GROUP BY `student_id` 求每日的乘客取消率 select t.Request_at as `Day`, ( round(avg(Sta
阅读全文
摘要:查找 部门工资前三高的所有员工 比如这题,找每个部门的工资前三名,那么先在子查询中用Employee和自己做连接, 连接条件是【部门相同但是工资比我高】,那么接下来按照having count(Salary) <= 2 来筛选的原理是:如果【跟我一个部门而且工资比我高的人数】不超过2个,那么我一定是
阅读全文
摘要:在一个字符串中找到第二个只出现4次的字符,如果不存在返回nul. import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.util.HashMap
阅读全文
摘要:程序计数器是一个比较小的内存区域,用于指示当前线程所执行的字节码执行到了第几行,是线程隔离的 方法区在JVM中也是一个非常重要的区域,它与堆一样,是被 线程共享 的区域。 在方法区中,存储了每个类的信息(包括类的名称、方法信息、字段信息)、静态变量、常量以及编译器编译后的代码等。 虚拟机栈描述的是J
阅读全文
摘要:1、static关键字基本概念 方便在没有创建对象的情况下来进行调用。 即被static关键字修饰的不需要创建对象去调用,直接根据类名就可以去访问。 static关键字修饰类(内部类) java里面static一般用来修饰成员变量或函数。但有一种特殊用法是用static修饰内部类,普通类是不允许声明
阅读全文
摘要:数据仓库 英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。 它出于分析性报告和决策支持目的而创建。 数据仓库与数据库区别 数据库与数据仓库的区别实际讲的是 OLTP 与 OLAP 的区
阅读全文
摘要:Sqoop 基本概念 Apache Sqoop是一个性能高、易用、灵活的数据导入导出工具,在关系型数据库与Hadoop之间搭建了一个桥梁。 # 应用场景 需要将HDFS或Hive上的数据导出到传统关系型数据库中(如MySQL、Oracle等),或者将传统关系型数据库中的数据导入到HDFS或Hive上
阅读全文
摘要:集群搭建及工具使用 身为大数据开发工程师,对数据从采集、接入、流处理、批处理到数据存储、数据分析和数据可视化等一整套流程都要了解,包括的组件非常多。 做数据流处理需要掌握spark、flink、storm、kafka stream等。 做批处理需要掌握hadoop、hive等,数据存储需要掌握hdf
阅读全文
摘要:| https://www.lagou.com/jobs/list_java%E5%A4%A7%E6%95%B0%E6%8D%AE?oquery=%E5%A4%A7%E6%95%B0%E6%8D%AE&fromSearch=true&labelWords=relative 大数据分析师 关键词:新零
阅读全文
摘要:1. HTTP状态码(常见) 什么是HTTP状态码(HTTP Status Code) 当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。 最常见的状态
阅读全文

浙公网安备 33010602011771号