随笔分类 - sql 百炼成神
摘要:超多sql分步骤类型题解 --推荐簇每个userId,超过2个相似用户(score>50)购买过的item,排除掉自己购买过的item 想了想,没有套路,就是多练 # --订单表: orders ; 字段: userId , itemId , addTime # --相似度表: similar ;
阅读全文
摘要:with as,lag 使用with as有如下好处 1、可以轻松构建一个临时表,通过对这个表数据进行再处理。但是他比临时表更强大,临时表在会话结束才会自动被清除,但with as临时表查询完成后就被清除了 2、复杂的查询会产生很大的sql,with as语法可以把一些公共查询提出来,也可以作为一个
阅读全文
摘要:sql编写小结 一般的题目:子查询或表连接即可 难一点的题目,需要用到高级函数,本质上还是使用简单查询语句的拼接。这个会有专门的篇章去做归纳汇总。 经典题目讲解 每天下单的老客数量 --每天下单的老客数量(老客:当天之前有购买过) --订单表:orders; 字段:userId,itemId,add
阅读全文
摘要:为了解决该题,先捋一下sql解题的基本两种方法:表连接和子查询 # 建表 CREATE DATABASE IF NOT EXISTS company; USE company; CREATE TABLE customer( user_id VARCHAR(10) NOT NULL, user_nam
阅读全文
摘要:Employee 表保存了一年内的薪水信息。 请你编写 SQL 语句,对于每个员工,查询他除最近一个月(即最大月)之外,剩下每个月的近三个月的累计薪水(不足三个月也要计算)。 结果请按 Id 升序,然后按 Month 降序显示。 示例: 输入: | Id | Month | Salary | | |
阅读全文
摘要:下图为一张订单表(order1),现希望查找出至少连续3天下单的用户。 第一步:将订单表按UserId分组根据日期Date排序 第二步:用日期Date减去对应的排序号Num,若日期是连续的,则相减的结果Datedif相等。 第三步:按UserId,Datedif分组计数,得到各用户的连续下单天数。
阅读全文
摘要:sql 脚本 创建一个订单统计表格,并插入数据 create table `tb_order` ( `order_id` int (11), `user_id` int (11), `gmv` float , `create_date` datetime ); insert into `tb_ord
阅读全文
摘要:求每位同学考试成绩90分以上的优秀率 SELECT student_id,ROUND(AVG(score>90),2) FROM `score` GROUP BY `student_id` 求每日的乘客取消率 select t.Request_at as `Day`, ( round(avg(Sta
阅读全文
摘要:查找 部门工资前三高的所有员工 比如这题,找每个部门的工资前三名,那么先在子查询中用Employee和自己做连接, 连接条件是【部门相同但是工资比我高】,那么接下来按照having count(Salary) <= 2 来筛选的原理是:如果【跟我一个部门而且工资比我高的人数】不超过2个,那么我一定是
阅读全文
摘要:流量分析常见分类 指标是网站分析的基础,用来记录和衡量访问者在网站自的各种行为。常见的指标如下: 基础级指标 PageView浏览次数(PV):用户每打开1个网站页面,记录1个PV。用户多次打开同一页面PV累计多次。通俗解释就是页面被加载的总次数。 Unique Visitor独立访客(UV): 1
阅读全文
摘要:宽表窄表的引入 --需求:统计今天每个小时访问量有多少? --需要根据小时hour进行分组 group by 分组之后统计每个组内的个数count --当下:group by(substring(time_local,12,2)) --缺点:每一条记录在分组之前 都需要进行所谓的截取操作 --原因:
阅读全文
摘要:转载自 严阵以待 https://www.cnblogs.com/yanzhenyidai/p/13450965.html 上周客户说系统突然变得很慢,而且时不时的蹦出一个 404 和 500,弄得真的是很没面子,而恰巧出问题的时候正在深圳出差,所以一直没有时间 看问题,一直到今天,才算是把问题原因
阅读全文
摘要:文章转载自 微信公众号 数据管道 摘要 经常看到一份数据分析岗位的招聘要求:“熟练使用SQL”。那你真的熟练吗? 最基本的几个问题,SQL是什么?数据库是什么?RDBMS又是什么?什么叫表? 数据库(Database):按照数据结构来组织、存储和管理数据的仓库。 RDBMS:(Relational
阅读全文
摘要:1. 概念 其实就是一个容器(集合),存放数据库连接的容器。 当系统初始化好后,容器被创建,容器中会申请一些连接对象,当用户来访问数据库时,从容器中获取连接对象,用户访问完之后,会将连接对象归还给容器。 2. 好处 节约资源 用户访问高效 Druid:数据库连接池实现技术,由阿里巴巴提供的 步骤:
阅读全文
摘要:1.概念:Java DataBase Connectivity Java 数据库连接, Java语言操作数据库 JDBC本质:其实是官方(sun公司)定义的一套操作所有关系型数据库的规则,即接口。各个数据库厂商去实现这套接口,提供数据库驱动jar包。我们可以使用这套接口(JDBC)编程,真正执行的代
阅读全文
摘要:| 部分转载自 https://www.deeplearn.me/2892.html 一般写sql经常会遇到行转列或者列转行之类的操作,就像concat_ws之类的函数被广泛的使用,今天这个也是经常要使用的拓展方法。 背景介绍 explode与lateral view在关系型数据库中本身是不该出现的
阅读全文
摘要:1. 创建 Maven 工程 <dependencies> <!-- https://mvnrepository.com/artifact/org.apache.hive/hive-exec --> <dependency> <groupId>org.apache.hive</groupId> <a
阅读全文
摘要:1.hive介绍 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 其本质是将SQL转换为MapReduce的任务进行运算,底层由HDFS来提供数据的存储,说白了**hive可以理解为一个将SQL转换为MapReduce的任务的工具,甚
阅读全文
摘要:基本操作 help 帮助 help timpstampdiff; 登录 退出 - 登录 service mysqld start mysql -uroot -p123456 - 退出 quit 简单查询,不区分大小写 # 查看版本号及当前时间 select version(),user(),curr
阅读全文
摘要:SQL语句执行顺序 From 表连接 on连接条件,形成新的虚拟表 where 筛选条件 group by 生成新的结果集合 group by 分组列表 having 分组后筛选 select 选出显示的 order by 排序 limit 分页/个数限制 子查询顺序 除了exists,先执行子查询
阅读全文

浙公网安备 33010602011771号