Fork me on GitHub

随笔分类 -  大数据笔面试整理

摘要:jvm 内存模型 进程和线程的常见面试问题 线程池面试总结 阅读全文
posted @ 2020-09-09 09:52 园狐 阅读(190) 评论(0) 推荐(0)
摘要:求每位同学考试成绩90分以上的优秀率 SELECT student_id,ROUND(AVG(score>90),2) FROM `score` GROUP BY `student_id` 求每日的乘客取消率 select t.Request_at as `Day`, ( round(avg(Sta 阅读全文
posted @ 2020-08-19 14:10 园狐 阅读(1051) 评论(0) 推荐(0)
摘要:查找 部门工资前三高的所有员工 比如这题,找每个部门的工资前三名,那么先在子查询中用Employee和自己做连接, 连接条件是【部门相同但是工资比我高】,那么接下来按照having count(Salary) <= 2 来筛选的原理是:如果【跟我一个部门而且工资比我高的人数】不超过2个,那么我一定是 阅读全文
posted @ 2020-08-19 11:26 园狐 阅读(1321) 评论(0) 推荐(0)
摘要:在一个字符串中找到第二个只出现4次的字符,如果不存在返回nul. import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.util.HashMap 阅读全文
posted @ 2020-08-18 20:20 园狐 阅读(130) 评论(0) 推荐(0)
摘要:程序计数器是一个比较小的内存区域,用于指示当前线程所执行的字节码执行到了第几行,是线程隔离的 方法区在JVM中也是一个非常重要的区域,它与堆一样,是被 线程共享 的区域。 在方法区中,存储了每个类的信息(包括类的名称、方法信息、字段信息)、静态变量、常量以及编译器编译后的代码等。 虚拟机栈描述的是J 阅读全文
posted @ 2020-08-18 13:46 园狐 阅读(99) 评论(0) 推荐(0)
摘要:1、static关键字基本概念 方便在没有创建对象的情况下来进行调用。 即被static关键字修饰的不需要创建对象去调用,直接根据类名就可以去访问。 static关键字修饰类(内部类) java里面static一般用来修饰成员变量或函数。但有一种特殊用法是用static修饰内部类,普通类是不允许声明 阅读全文
posted @ 2020-08-06 20:04 园狐 阅读(768) 评论(0) 推荐(0)
摘要:数据仓库 英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。 它出于分析性报告和决策支持目的而创建。 数据仓库与数据库区别 数据库与数据仓库的区别实际讲的是 OLTP 与 OLAP 的区 阅读全文
posted @ 2020-08-05 09:48 园狐 阅读(413) 评论(0) 推荐(0)
摘要:Sqoop 基本概念 Apache Sqoop是一个性能高、易用、灵活的数据导入导出工具,在关系型数据库与Hadoop之间搭建了一个桥梁。 # 应用场景 需要将HDFS或Hive上的数据导出到传统关系型数据库中(如MySQL、Oracle等),或者将传统关系型数据库中的数据导入到HDFS或Hive上 阅读全文
posted @ 2020-08-02 17:27 园狐 阅读(778) 评论(0) 推荐(0)
摘要:集群搭建及工具使用 身为大数据开发工程师,对数据从采集、接入、流处理、批处理到数据存储、数据分析和数据可视化等一整套流程都要了解,包括的组件非常多。 做数据流处理需要掌握spark、flink、storm、kafka stream等。 做批处理需要掌握hadoop、hive等,数据存储需要掌握hdf 阅读全文
posted @ 2020-07-28 11:15 园狐 阅读(414) 评论(0) 推荐(0)
摘要:| https://www.lagou.com/jobs/list_java%E5%A4%A7%E6%95%B0%E6%8D%AE?oquery=%E5%A4%A7%E6%95%B0%E6%8D%AE&fromSearch=true&labelWords=relative 大数据分析师 关键词:新零 阅读全文
posted @ 2020-07-27 21:50 园狐 阅读(373) 评论(0) 推荐(0)
摘要:1. HTTP状态码(常见) 什么是HTTP状态码(HTTP Status Code) 当浏览者访问一个网页时,浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。 最常见的状态 阅读全文
posted @ 2020-07-27 14:55 园狐 阅读(157) 评论(0) 推荐(0)