摘要:
此专题为【滴滴司机专题】,博主我是盲写~ 本套题中大多数为中等题,少量简单题。 但限时一小时,对快速理解题意要求很高。 现有两个表,表1为司机基础信息表 drv,表2为订单基础信息表 od,字段的说明和部分展示见下: 表1 drv 表2 od 注:巴西(BR)时区比北京时间慢11小时;“五一” 期间 阅读全文
此专题为【滴滴司机专题】,博主我是盲写~ 本套题中大多数为中等题,少量简单题。 但限时一小时,对快速理解题意要求很高。 现有两个表,表1为司机基础信息表 drv,表2为订单基础信息表 od,字段的说明和部分展示见下: 表1 drv 表2 od 注:巴西(BR)时区比北京时间慢11小时;“五一” 期间 阅读全文
posted @ 2022-12-15 23:21
找回那所有、
阅读(77)
评论(0)
推荐(0)
摘要:
此专题为【连续登录专题】,难度均为中难题。 为避免错误,拆分模块较多,书写风格有点变态~ 表 login: 1. 求连续登录3天以上的用户数 方法一:lead、lag # 新建列: create temporary table tmp (select *, lag(date,1,0) over(pa 阅读全文
此专题为【连续登录专题】,难度均为中难题。 为避免错误,拆分模块较多,书写风格有点变态~ 表 login: 1. 求连续登录3天以上的用户数 方法一:lead、lag # 新建列: create temporary table tmp (select *, lag(date,1,0) over(pa 阅读全文
posted @ 2022-12-15 23:13
找回那所有、
阅读(81)
评论(0)
推荐(0)

基于原理理解,介绍 inner join 和 outer join 的使用技巧,这里不涉及外连接行列转换。 1. inner join: 在店铺表中找到含商品表中所有商品的店铺: select shop from items,shopitems where items.item = shopitem
self join 理解上偏抽象,这里做记录。 *sql 面向集合,二维表实质是集合。 1. cross join: 自连接:将同一张表复制成两张,通过 cross join 产生笛卡尔积。 select p1.name,p2.name from products as p1,products as
一家公司的商业价值 =(其拥有的用户数量 × 平均单体用户价值)- 流量营销成本 - 交付供给成本 对于To B,类似地: 一家公司的供应价值 =(其拥有的客户数量 × 平均单体客户价值)- 成本 = [ 其拥有的客户数量 × (平均单体客户带来的GMV × 佣金)] - 成本 行业里的一切运营在做
序言、写在前面 这是我关于数据sense的第一篇博文。 从22年9月到23年6月,我开始不停地写,几乎很少断更。 但从那之后,断更了六个月,应该是太忙了。 这个专题并不会那么细节,更适合有一定基础的读者食用,更关注在数据sense方面。 作为第一篇博文,它并不那么核心,相反它是个很好的引子。 真正重
模型亮点 测试集上评分为1.0 数据集由sklearn自带 以下为模型具体实现 Step1.数据读取 how 数据读取? 使用load_iris命令,加载鸢尾花数据集 from sklearn.datasets import load_iris iris=load_iris() x=iris.dat
模型亮点 初始测试集上评分为0.29,调参后测试集上评分为0.98 数据集由sklearn自带 以下为模型具体实现 Step1.数据读取 使用load_iris命令,加载鸢尾花数据集 from sklearn.datasets import load_iris iris=load_iris() x=
模型亮点 初始测试集上评分为0.36,调参后测试集上评分为0.77 数据集由sklearn生成 以下为模型具体实现 Step1.数据读取 how 数据读取? 使用make_blobs命令,生成数据集 可指定样本数、特征数、聚类簇数等,以测试聚类算法 from sklearn.datasets imp
模型亮点 初始测试集上评分为0.51,调参后测试集上评分为0.75 数据集由sklearn自带 以下为模型具体实现 Step1.数据读取 how 数据读取? 使用load_iris命令,加载鸢尾花数据集 from sklearn.datasets import load_iris iris=load
模型亮点 随机森林,初始测试集上评分为0.53,调参后测试集上评分为0.85 梯度提升决策树,初始测试集上评分为0.56,调参后测试集上评分为0.88 以下为模型具体实现 Step1.数据读取 import pandas as pd df=pd.read_csv('bankpep.csv',inde
模型亮点 初始测试集上评分为0.4,调参后测试集上评分为0.8 数据清洗方式得当 以下为模型具体实现 Step1.数据读取 import pandas as pd df=pd.read_csv('bankdebt.csv',index_col=0,header=None) df.columns=['
模型亮点 初始测试集上评分为0.56,调参后测试集上评分为0.85 数据清洗方式得当 以下为模型具体实现 Step1.数据读取 import pandas as pd df=pd.read_csv('bankpep.csv',index_col='id') df.head() Step2.数据清洗
浙公网安备 33010602011771号