05 2019 档案

摘要:因为sklearn cross_val_score 交叉验证,这个函数没有洗牌功能,添加K 折交叉验证,可以用来选择模型,也可以用来选择特征 sklearn.model_selection.cross_val_score(estimator, X, y=None, groups=None, scor 阅读全文
posted @ 2019-05-24 23:01 东西 阅读(8023) 评论(0) 推荐(0)
摘要:50道SQL练习题及答案与详细分析(MySQL) 网上的经典50到SQL题,经过一阵子的半抄带做,基于个人理解使用MySQL重新完成一遍,感觉个人比较喜欢用join,联合查询较少 希望与大家一起学习研究改进,欢迎指点 数据表介绍 1.学生表 Student(SId,Sname,Sage,Ssex) 阅读全文
posted @ 2019-05-06 15:59 东西 阅读(4616) 评论(1) 推荐(0)
摘要:MySQL8.0 (ROW_NUMBER)窗口函数 排名 暂时理解函数意义,后面再进行优化,如果有关变量排序,查看这个大哥的 "mysql的分组排序和变量赋值顺序" 先查看一个例子: row_number() over(partition by sid order by score desc) 使用 阅读全文
posted @ 2019-05-06 10:41 东西 阅读(3545) 评论(0) 推荐(1)
摘要:数据分析之业务知识(指标) 需要理解业务,才能建立业务数据模型 指标 01市场营销指标 客户用户生命周期 企业/产品消费者在整个业务关系阶段的周期 潜在用户、兴趣用户、新客户、老/熟客户、流失客户 用户价值 单个用户贡献 = 产出量/ 投入量 用户价值(贡献1 + ......+ 贡献2) eg: 阅读全文
posted @ 2019-05-03 21:04 东西 阅读(597) 评论(0) 推荐(0)
摘要:pandas导入数据到MySQL 1.导入必要的库 2.创建链接 3.导入数据 root: 你的mysql数据库用户名 password:数据库密码 dbname : 数据库名 df: 数据 'tablename' : 表名 schema='数据库名称' if_exists : 如果存在 repla 阅读全文
posted @ 2019-05-03 11:51 东西 阅读(1580) 评论(0) 推荐(0)