Stata零散知识点的记录

mat list 与matlist的区别:

  • matlist is an extension of the matrix list command。
  • mat list 只能打印一个完整的矩阵,而matlist则可以根据行列数或者行列名打印部分矩阵。
  • matlist 有更多的控制选项,可以更多地改变矩阵的展示方式。
  • 实例:
. matlist result[1,1]

             |        c1 
-------------+-----------
          r1 |  .7976218 
. mat list result[1,1]
[ invalid name
matrix [1,1] not found
r(111);

Stata中第三方矩阵相关的命令

  • matmap Given matrix A and a user-supplied expression, matmap calculates matrix B with typical element

  • matewmf Given matrix A and a user-supplied monadic function f with Stata syntax f( ), matewmf calculates and displays matrix B with typical element

通过矩阵一次性获得多个变量均值的方法

  • tabstat
tabstat firm_refer num_pat,save
return list
mat total = r(StatTotal)
  • mean
mean varlist
mat define mean_vector = e(b)

记录一个看起来很厉害但是还没来得及研究使用的命令:

flexmat
flexmat -- Creates a flexible matrix of real, string and complex elements

Oaxaca分解中固定效应系数的计算方法

根据

Jann, B. and Others, A Stata implementation of the Blinder-Oaxaca decomposition. Stata journal, 2008. 8(4): p. 453--479.

一文中所描述的方法:
image

  • 普通固定效应系数计算方法:
    以年份和学科的固定效应为例,将回归所得的年份固定效应系数取平均数(算上基准组)即得上图中的c,然后将回归所得的系数减去c即为OB分解中的固定效应系数。
  • 常数项计算方法:
    回归所得的常数项加上年份固定效应均值(c1)和学科固定效应均值(c2)即为OB分解中的常数项。

Stata计算程序运行时间的方法

scalar t1 = c(current_time)
运行程序
scalar t2 = c(current_time)
display (clock(t2, "hms") - clock(t1, "hms")) / 1000 " seconds"

Excel格式日期转Stata日期格式

gen date = Excel日期 + td(30dec1899)
format date %tdCCYY.NN.DD

需要注意的是,如果Excel日期中包含小时和分钟,也必须加上td(30dec1899),否则会无法准确识别日期

将一个字符型变量的值作为值标签赋予给另一个数值型变量

labmask CODE_CITY,values( 市 ) lblname(CITY)

以城市的名称(字符型变量)和行政代码(数值型变量)为例,上述命令中CODE_CITY为城市的行政代码,市为城市的名字。该命令只能将字符型变量作为值标签赋给数值型变量,反之则不行,lblname()用于指定值标签的名称。

回归系数画图:coefplot

coefplot (co_dyn01,label("第一个回归的名字")) (year_dyn01, label("第二个回归的名称")), drop( 不需要展示的系数 ) yline(0) rename(2000b.year#c.fund_dif2 = 2000b.year#c.fund_dif  两个回归中相同系数可能有不同的名字,rename可以重命名系数的名字 从而达到合并展示的目的 ) coeflabels(2000b.year#c.fund_dif = "2000" 修改系数在坐标轴上的标签)  vertical nooffsets

matchit与freqindex

  • matchit可用于模糊匹配,但其匹配效率貌似很低;python中的difflib.get_close_matches也可以实现模糊匹配,可以作为备选
  • matchit的实现需要freqindex,有空研究下这个命令是干啥的

factor variable

  • stata中对于交乘项和虚拟变量的设定方式可以在 help factor variable 中查看

stata的多进程性能评估

https://www.stata.com/statamp/statamp_20210611.pdf

posted @ 2022-11-02 18:24  梁书源  阅读(392)  评论(0)    收藏  举报