上一页 1 2 3 4 5 6 7 ··· 17 下一页
摘要: 针对相同的表进行的连接被称为“自连接”(self join)。 那么为什么要把相同的一张表连接起来呢?一开始还是挺难理解的。把它想象成连接两张不同的表,这样容易理解一些。事实上,自连接还是有很多用处的。 自连接的用途: 1,在同一张表内进行比较 例子:查找收入超过各自经理的员工的姓名 Id | Na 阅读全文
posted @ 2020-03-23 14:15 HuZihu 阅读(18344) 评论(0) 推荐(2)
摘要: 关联子查询和普通子查询的区别在于:1,关联子查询引用了外部查询的列。 2,执行顺序不同。对于普通子查询,先执行普通子查询,再执行外层查询;而对于关联子查询,先执行外层查询,然后对所有通过过滤条件的记录执行内层查询。 语法: SELECT column1, column2 FROM table1 AS 阅读全文
posted @ 2020-03-23 11:08 HuZihu 阅读(4778) 评论(0) 推荐(1)
摘要: CASE表达式是用来判断条件的,条件成立时返回某个值,条件不成立时返回另一个值。 语法: CASE WHEN ComparsionCondition THEN result WHEN ComparsionCondition THEN result ELSE other END (注:各分支返回的数据 阅读全文
posted @ 2020-03-18 13:58 HuZihu 阅读(706) 评论(0) 推荐(0)
摘要: 在大多数编程语言中,代码是按照编码顺序执行的,但是在SQL语言中,尽管SELECT语句第一个出现,但却不是第一个被执行的。 SQL查询语句内部执行顺序: from子句 >where子句 >group by子句 >聚合函数 >having子句 >select 字段 >order by子句 每个执行步骤 阅读全文
posted @ 2020-03-12 22:52 HuZihu 阅读(711) 评论(0) 推荐(0)
摘要: 窗口可以理解为记录集合,窗口函数就是在满足某种条件的记录集合上执行的特殊函数。窗口函数也称为OLAP函数,OLAP即实时分析处理(Online Analytical Processing)。 语法: window_function (expression) OVER ( [ PARTITION BY 阅读全文
posted @ 2020-03-10 17:07 HuZihu 阅读(7981) 评论(0) 推荐(1)
摘要: 我们用训练集训练出一个初步的模型后,并不能直接使用该模型,而是要对该模型进行诊断,并不断对模型进行调整。 现以普林斯顿大学教授工资数据集为例,来说一下如何对模型进行诊断和对结果进行解读。数据集下载地址:http://data.princeton.edu/wws509/datasets/salary. 阅读全文
posted @ 2020-03-03 09:19 HuZihu 阅读(3736) 评论(0) 推荐(0)
摘要: 如何找出模型需要的特征?首先要找到该领域的业务专家,让他们给一些建议。比如我们需要解决一个药品疗效的分类问题,那么先找到领域专家,向他们咨询哪些因素(特征)会对该药品的疗效产生影响,较大影响和较小影响的因素都要。这些因素就是我们特征的第一候选集。(摘自:https://www.cnblogs.com 阅读全文
posted @ 2020-02-29 10:33 HuZihu 阅读(3028) 评论(0) 推荐(0)
摘要: 线性回归模型比较常见的特征选择方法有两种,分别是最优子集和逐步回归。此外还有正则化,降维等方法。 1,最优子集(Best Subset Selection):从零号模型(null model)M0开始,这个模型只有截距项而没有任何自变量。然后用不同的特征组合进行拟合,从中分别挑选出一个最好的模型(R 阅读全文
posted @ 2020-02-21 22:22 HuZihu 阅读(20091) 评论(0) 推荐(0)
摘要: 在《机器学习 最小二乘线性回归模型的5个基本假设(Machine Learning Least Squares Linear Regression Assumptions)》一文中阐述了最小二乘线性回归的5个基本假设以及违反这些假设条件会产生的后果。那么,我们怎么检测出是否有违反假设的情况出现以及如 阅读全文
posted @ 2020-02-16 18:21 HuZihu 阅读(1954) 评论(0) 推荐(0)
摘要: 一,定义 异常点(Outlier):残差很大的点(即:因变量y的值是极端值的观测值) 高杠杆点(High Leverage Point):远离样本空间中心的点(即:自变量x的值是极端值的观测值) 强影响点(Influential Point):对模型有较大影响的点,如果删除该点能改变拟合回归方程 注 阅读全文
posted @ 2020-02-16 10:49 HuZihu 阅读(20595) 评论(2) 推荐(3)
上一页 1 2 3 4 5 6 7 ··· 17 下一页