sql 百炼成神 - 随笔分类 - 园狐

超多sql分步骤类型题解

摘要：超多sql分步骤类型题解 --推荐簇每个userId，超过2个相似用户(score>50)购买过的item，排除掉自己购买过的item 想了想，没有套路，就是多练 # --订单表： orders ; 字段： userId ， itemId ， addTime # --相似度表： similar ; 阅读全文

posted @ 2020-10-08 21:43 园狐阅读(355) 评论(0) 推荐(0)

sql 高级函数

摘要：with as,lag 使用with as有如下好处 1、可以轻松构建一个临时表，通过对这个表数据进行再处理。但是他比临时表更强大，临时表在会话结束才会自动被清除，但with as临时表查询完成后就被清除了 2、复杂的查询会产生很大的sql，with as语法可以把一些公共查询提出来，也可以作为一个阅读全文

posted @ 2020-10-08 20:24 园狐阅读(474) 评论(0) 推荐(0)

sql 每天下单的老客数量

摘要：sql编写小结一般的题目：子查询或表连接即可难一点的题目，需要用到高级函数，本质上还是使用简单查询语句的拼接。这个会有专门的篇章去做归纳汇总。经典题目讲解每天下单的老客数量 --每天下单的老客数量(老客：当天之前有购买过) --订单表：orders; 字段：userId，itemId，add 阅读全文

posted @ 2020-10-08 13:41 园狐阅读(847) 评论(0) 推荐(0)

sql - 统计每天的新客人数和老客人数

摘要：为了解决该题，先捋一下sql解题的基本两种方法：表连接和子查询 # 建表 CREATE DATABASE IF NOT EXISTS company; USE company; CREATE TABLE customer( user_id VARCHAR(10) NOT NULL, user_nam 阅读全文

posted @ 2020-09-21 11:49 园狐阅读(2941) 评论(0) 推荐(0)

查询员工的累计薪水

posted @ 2020-09-02 01:11 园狐阅读(576) 评论(0) 推荐(0)

sql 查询至少连续n天下单的用户

摘要：下图为一张订单表（order1），现希望查找出至少连续3天下单的用户。第一步：将订单表按UserId分组根据日期Date排序第二步：用日期Date减去对应的排序号Num，若日期是连续的，则相减的结果Datedif相等。第三步：按UserId，Datedif分组计数，得到各用户的连续下单天数。阅读全文

posted @ 2020-08-20 15:06 园狐阅读(2408) 评论(0) 推荐(0)

SQL 行转列（统计每天，每个用户的消费金额）及sql 查询连续天数示例

摘要：sql 脚本创建一个订单统计表格，并插入数据 create table `tb_order` ( `order_id` int (11), `user_id` int (11), `gmv` float , `create_date` datetime ); insert into `tb_ord 阅读全文

posted @ 2020-08-20 15:05 园狐阅读(3232) 评论(0) 推荐(0)

SQL 分组后进行相关统计

摘要：求每位同学考试成绩90分以上的优秀率 SELECT student_id,ROUND(AVG(score>90),2) FROM `score` GROUP BY `student_id` 求每日的乘客取消率 select t.Request_at as `Day`, ( round(avg(Sta 阅读全文

posted @ 2020-08-19 14:10 园狐阅读(1051) 评论(0) 推荐(0)

SQL 分组内取前几名的问题

摘要：查找部门工资前三高的所有员工比如这题，找每个部门的工资前三名，那么先在子查询中用Employee和自己做连接，连接条件是【部门相同但是工资比我高】，那么接下来按照having count(Salary) <= 2 来筛选的原理是：如果【跟我一个部门而且工资比我高的人数】不超过2个，那么我一定是阅读全文

posted @ 2020-08-19 11:26 园狐阅读(1322) 评论(0) 推荐(0)

网站流量日志分析（模块开发----统计分析理论）

摘要：流量分析常见分类指标是网站分析的基础，用来记录和衡量访问者在网站自的各种行为。常见的指标如下：基础级指标 PageView浏览次数（PV）:用户每打开1个网站页面，记录1个PV。用户多次打开同一页面PV累计多次。通俗解释就是页面被加载的总次数。 Unique Visitor独立访客（UV）: 1 阅读全文

posted @ 2020-08-11 08:53 园狐阅读(810) 评论(0) 推荐(0)

网站流量日志分析（扩展—明细表）

摘要：宽表窄表的引入 --需求：统计今天每个小时访问量有多少？ --需要根据小时hour进行分组 group by 分组之后统计每个组内的个数count --当下：group by(substring(time_local,12,2)) --缺点：每一条记录在分组之前都需要进行所谓的截取操作 --原因：阅读全文

posted @ 2020-08-11 08:36 园狐阅读(470) 评论(0) 推荐(0)

排查Mysql突然变慢的一次过程

摘要：转载自严阵以待 https://www.cnblogs.com/yanzhenyidai/p/13450965.html 上周客户说系统突然变得很慢，而且时不时的蹦出一个 404 和 500，弄得真的是很没面子，而恰巧出问题的时候正在深圳出差，所以一直没有时间看问题，一直到今天，才算是把问题原因阅读全文

posted @ 2020-08-07 10:46 园狐阅读(1563) 评论(0) 推荐(0)

SQL 基本语句规范

摘要：文章转载自微信公众号数据管道摘要经常看到一份数据分析岗位的招聘要求：“熟练使用SQL”。那你真的熟练吗？最基本的几个问题，SQL是什么？数据库是什么？RDBMS又是什么？什么叫表？数据库（Database）：按照数据结构来组织、存储和管理数据的仓库。 RDBMS：(Relational 阅读全文

posted @ 2020-08-06 20:55 园狐阅读(589) 评论(0) 推荐(0)

JDBC 连接池

摘要：1. 概念其实就是一个容器(集合)，存放数据库连接的容器。当系统初始化好后，容器被创建，容器中会申请一些连接对象，当用户来访问数据库时，从容器中获取连接对象，用户访问完之后，会将连接对象归还给容器。 2. 好处节约资源用户访问高效 Druid：数据库连接池实现技术，由阿里巴巴提供的步骤：阅读全文

posted @ 2020-08-06 20:45 园狐阅读(123) 评论(0) 推荐(0)

JDBC基础

摘要：1.概念：Java DataBase Connectivity Java 数据库连接， Java语言操作数据库 JDBC本质：其实是官方（sun公司）定义的一套操作所有关系型数据库的规则，即接口。各个数据库厂商去实现这套接口，提供数据库驱动jar包。我们可以使用这套接口（JDBC）编程，真正执行的代阅读全文

posted @ 2020-08-06 20:25 园狐阅读(140) 评论(0) 推荐(0)

爆炸函数 explode

摘要：| 部分转载自 https://www.deeplearn.me/2892.html 一般写sql经常会遇到行转列或者列转行之类的操作，就像concat_ws之类的函数被广泛的使用，今天这个也是经常要使用的拓展方法。背景介绍 explode与lateral view在关系型数据库中本身是不该出现的阅读全文

posted @ 2020-08-06 07:38 园狐阅读(4395) 评论(0) 推荐(0)

创建 hive 用户自定义函数UDF,UDTF,UDAF

摘要：1. 创建 Maven 工程 <dependencies>  <dependency> <groupId>org.apache.hive</groupId> <a 阅读全文

posted @ 2020-08-05 21:00 园狐阅读(890) 评论(0) 推荐(1)

hive 基础与进阶

摘要：1.hive介绍 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。其本质是将SQL转换为MapReduce的任务进行运算，底层由HDFS来提供数据的存储，说白了**hive可以理解为一个将SQL转换为MapReduce的任务的工具，甚阅读全文

posted @ 2020-08-05 08:32 园狐阅读(279) 评论(0) 推荐(0)

MySQL进阶

摘要：基本操作 help 帮助 help timpstampdiff; 登录退出 - 登录 service mysqld start mysql -uroot -p123456 - 退出 quit 简单查询，不区分大小写 # 查看版本号及当前时间 select version(),user(),curr 阅读全文

posted @ 2020-08-04 22:14 园狐阅读(221) 评论(0) 推荐(0)

SQL 基础整理

摘要：SQL语句执行顺序 From 表连接 on连接条件，形成新的虚拟表 where 筛选条件 group by 生成新的结果集合 group by 分组列表 having 分组后筛选 select 选出显示的 order by 排序 limit 分页/个数限制子查询顺序除了exists，先执行子查询阅读全文

posted @ 2020-07-27 15:18 园狐阅读(214) 评论(0) 推荐(0)

园狐

谋定而后动，知止而有得。

随笔分类 - sql 百炼成神

公告