随笔分类 - stata基础
摘要:一、 为什么要进行对数化处理 1. 缩小数据的绝对数值,方便计算。 例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了;在实证模型中,缩小值之后相关系数数值会更大一些(原值可能需要四到五位有效数字)。 2. 取对数后,可以将乘法计算转换称加法
阅读全文
摘要:我们先引入一个简单的收入回归方程: 其中Wage 是小时工资,Di 为是否接受工作培训的虚拟变量,X是控制变量。 假设我们想看一下D 对Wage 的影响是否因性别而异。我们即可以引入交互项: 观察交互项的系数 是否显著即可: 也可以使用分组回归: 然后再检验Di 的回归系数差异是否显著即可。 不难发
阅读全文
摘要:2. 选择性偏差校正 2.1 选择模型 选择模型有两种主要应用,一是 处理效应 (treatment effect model),即回归模型中包含一个内生的指示变量 ()。例如,管理层是否发布盈余预测 ( 或 0) 对资本成本影响。二是 样本选择 (sample selection model),即
阅读全文
摘要:数据清理第一步:整体数据查看 一、查看识别变量--isid、duplicates 一般而言,每个数据集都有唯一一个识别每条记录的识别符(重复测量的长型数据除外)。Stata检查唯一识别符是否唯一的命令为isid(或许是is this an ID的缩写)。isid允许同时检查多个唯一识别符,如果没有返
阅读全文
摘要:Stata操作 工具变量法的难点在于找到一个合适的工具变量并说明其合理性,Stata操作其实相当简单,只需一行命令就可以搞定,我们通常使用的工具变量法的Stata命令主要就是ivregress命令和ivreg2命令。 ivregress命令 ivregress命令是Stata自带的命令,支持两阶段最
阅读全文
摘要:1.1 工具变量法 OLS 有一个经典的假设:解释变量与随机误差项不相关,即 。如果存在解释变量违背了这个假设,则估计出的参数是有偏的,也是不一致的。 工具变量 (IV) 法为解决「内生解释变量」问题提供了一种可行的方法。为此,我们需要找到满足以下条件的「外生解释变量 (z)」: 与内生解释变量相关
阅读全文
摘要:一、解释变量内生性检验 首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。 reg ld
阅读全文
摘要:1. 五分位(中位数) by year,sort:egen distance_ew_median=median(Ln_geodistance_ew) gen distance_ew_high=(Ln_geodistance_ew>distance_ew) if Ln_geodistance_ew!=
阅读全文
摘要:1. 建立新变量 gen z=x*y 2. addition to typing variable names from your data, you can type factor variables, which might look like i.varname i.varname#i.var
阅读全文
摘要:1. PSM 简介在经济学中,我们通常希望评估某项公共政策实施后的效应,为此,我们构建 "处理组" 和 "控制组" 以评估「处理效应 (treatment effect)」。然而,我们的数据通常来自非随机的观察研究中,处理组和控制组的初始条件不完全相同,故存在「选择偏差 ( selection bi
阅读全文
摘要:1.引言 一篇实证论文中,最基本也是最重要的部分就是展示 Stata 中得出的统计分析、回归结果等表格。但自己动手做表格往往非常繁琐,Word 排版也常常令人抓狂。而 outreg2 命令可以让 Stata 自动输出我们想要的表格,为你解决所有结果输出的烦恼。因此,熟练掌握 outreg2 命令对我
阅读全文
摘要:对于面板数据,我们有多种估计方法,包括混合OLS、固定效应(FE)、随机效应(RE)和最小二乘虚拟变量(LSDV)等等。不过,我们最为常用的估计方法那自然还是固定效应(组内估计),固定效应模型的Stata官方命令是xtreg,但它有时候其实并没有那么好用(如对数据格式有要求,运行速度慢等),我们经常
阅读全文
摘要:问题:实证分析中,经常需要对比分析两个子样本组的系数是否存在差异。例如,在公司金融领域,研究薪酬激励是否有助于提升业绩时,模型设定为:关注的重点是系数 。我们经常把样本组分成“国有企业(SOE)”和“民营企业(PRI)”两个样本组,继而比较 和 是否存在差异。通常认为,民营企业的薪酬激励更有效果,即
阅读全文
摘要:将以实例介绍 ivregress 两阶段回归中 esttab, outreg2, asdoc 三种输出命令的优劣之处。 1. 输出命令介绍 1.1 esttab 命令简介 新的 esttab 命令是 estout 的包装器。它的语法比 estout 简单得多,而且默认情况下,它会在 Stata 结果
阅读全文
摘要:1. astile : 一个简明介绍 astile 可根据已有变量创建一个按 1 到 n 的等级排列的分级变量。 例如,我们可能有兴趣创建 10 个以公司大小为基础区分的公司分级组合。也就是将包含最小 10% 数值的公司设定为第 1 组,接下来的 10% 设定为第 2 组,依次类推, astile
阅读全文
摘要:predict后面加或不加option选项xb,生成的都是线性拟合值(linear prediction),跟残差项没半点关系。你用predict u或者predict e,得到了两个模型的拟合值,区别仅仅在于一个名字叫u,一个名字叫e。 要想求残差项,其实你再往下走一步就可以了:残差项等于被解释变
阅读全文
摘要:1. xtivreg2 实现了具有可能的内源性回归的固定效应和一阶差分面板数据模型的IV / GMM估计 是一个适当地调用-ivreg2-转换数据的程序来做估计。因此,被称为-ivreg2-的“包装器”。 2. ivreg2 和 xtivreg2 之间的差异,与reg 和 xtreg 之间的差异大体
阅读全文
摘要:1. 将文件夹中的excel批量转成dta文件 PS. 一定要记得将第一行添加为变量,不然会很崩溃。后面处理一直有格式问题 //将文件夹下所有excel文件转化成dta格式 cd "C:\Users\admir\Desktop\分析师预测\process\2019\Fenddt2020" xls2d
阅读全文
摘要:foreach循环:跟的对象可以是宏、变量名和文件名等 Braces must be specified with foreach, and 1. the open brace must appear on the same line as the foreach; 2. nothing may f
阅读全文
摘要:1. merge横向精确合并 一般来说,用到stata进行数据合并,都应该是用1:1合并,这才能一一对应,所以,非一一对应的合并我就不说了。免得混乱。 一般来说,善用生成的 _merge 变量来删除不要的匹配,再加上知道下面的几种情况怎么匹配,基本上已经够用了。 (merge的用于匹配的变量格式必须
阅读全文