随笔分类 - Stata
摘要:易错点注意: 若条件是“varname>某值”,则必须加一个非空条件:& !missing(varname) 变量名长度限制在10 characters内 重命名之后,要在label最后记录原变量名(原变量名) Variable name When planning names, anticipat
阅读全文
摘要://第一步,KMO检验和Bartlett球形检验,判断是否具有结构效度,从而决定能否使用因子分析。 factortest X1-X5 // KMO的数值衡量变量指标间的偏相关性,一般0.6以上,可以使用因子分析; // Bartlett检验的p值显著,需要使用因子分析。测度各指标变量间的相关性程度,
阅读全文
摘要:回答1:一般是结合特征值和累计贡献率来看的 累计贡献率在80%以上就可以了。 回答2: 特征值大于1或者累计方差解释率大于某个具体数值如60%、85%等,这些都是经验值,而不是必须严格遵守的要求。就我看的文献来说,也可以加入特征值小于1的因子。比如易志高和茅宁老师在构建中国情绪指数(CICSI)时,
阅读全文
摘要:browse if xxx 比如,我想查看变量x缺失的样本: browse if missing(age0_14) //厉害的命令
阅读全文
摘要:参考:https://bbs.pinggu.org/thread-7797826-1-1.html 比如识别变量是stkcd year,我想对每年所有城市的y指标进行排序,如果单纯地使用: bysort year: egen ranky = rank(y),field 就会导致同一个城市的不同stk
阅读全文
摘要:v1变量中的数据如下所示: YYYY-MM-DD 点击查看代码 generate v2 = date(v1, "YMD") format %td v2 YMD称为掩码,它告诉Stata指定日期部分的顺序。第二行将为变量分配Stata每日日期格式,这意味着当您查看数据中的该变量时,它将以人类可读的形式
阅读全文
摘要:merge后一定要(在处理好merge的数据后)drop _m 否则 variable _merge already defined
阅读全文
摘要:宏 doesn't work 点击查看详细内容 点击查看背景 两张表的数据,阿克苏地区死活匹配不上,查看excel原始数据,名称没有异常。 再查看主表dta,妈呀,啥时候阿克苏地区变成“阿克苏市”了,没有一条代码修改了阿克苏的名称啊! 没有其他更值得怀疑的点——问题只可能出在上面那条macro上。要
阅读全文
摘要:reshape long pop, i(city) j(year)
阅读全文
摘要:数据对数标准化处理的两个作用: 1.消除数据异方差 2.研究变量之间的弹性关系。 在没有进行对数变换之前,变量之间的联动关系表现为自变量的变动引起因变量变动的程度,在进行对数变换之后,变量的联动关系就表现为自变量变动的百分比引起因变量变动的百分比的程度。 当通过“相关性分析:方差·协方差矩阵” 发现
阅读全文
摘要:国泰安数据很多重复值 //1.判断标准是两种:年报,股权链计算所得 //2.一致行动人为多人时,每位行动人的名称尤其自然人的名字都会成为一条观测,所以导致stkcd year会有很多重复值。 另外,对国有或非国有的判断只依赖一个变量区分,可能出错。 cd "E:\project\general\da
阅读全文
摘要:使用mergeall命令不成功,显示**too many variables specified**,原因是有的dta中识别变量数据不唯一。 should have done: 预警信号: 对应的y观测大致4800,而某些控制变量的数据经过初处理,数量竟然多至40,000,必然是有重复数据的!除了`
阅读全文
摘要://financial year ended 财务年度结束的日期 //步骤分解法 gen fye=mdy(12,31,yr) format fye %d gen listage=(fye-listing_date)/365 //一步到位法 gen listage=(mdy(12,31,year)-l
阅读全文
摘要:参考:stata批量读入excel文件,并合并为一个dta文件 cd "E:\账面市值比(2000-2020)" local files: dir . files "*.xls" foreach file of local files { import excel using `"`file'"',
阅读全文
摘要://剔除B股数据:沪市B股代码的打头数字是900,深市B股是200打头。 drop if stkcd>=900000 drop if 200000<=stkcd&stkcd<=200999 疑惑:条件为什么不能合写?
阅读全文
摘要:参考:Stata: 正则表达式和文本分析 //判断字段”X“中是否含有数字以外的文字或符号,如果有,查找是什么文字/符号。 tab X if regexm( X , "[^0-9 .]") 方法二:d varlist 元字符 含义 举例 \ 后向引用,后面跟正则表达式中的某个元字符,表示匹配该符号。
阅读全文
摘要://对v1、v2排序并分组,生成num1等于某组的观测值总数 bysort v1 v2: gen num1 = _N //v2只排序不分组,生成num2等于某组的观测值总数。 bysort v1 (v2): gen num2 = _N 只排序不分组的变量,bys中要加()
阅读全文
摘要:错误代码1: list if city =="" replace city ="涪陵市" if stkcd ==688 & year==1997|1998 知道错误原因吗? replace city_office="涪陵市" if stkcd ==688 & year==1997|year==199
阅读全文

浙公网安备 33010602011771号