随笔分类 - stata
摘要:试图用来insheet从.csv文件加载数据集.但是,数据集中的分隔符","(包括引号)而不是简单的逗号,.因此.csv文件中的前三行看起来像这样:Name","Sex","Income John","M","45000Jane","F","20000它似乎insheet不允许多字符分隔符 - 我收
阅读全文
摘要:list,sep(0)//显示所有观测值,无分隔线 list j* in 1/5//显示前五条记录的所有j开头的变量观测值list kh-jdt6 in 1/8 ,sep(0)//显示前8条记录的变量名kh与jdt6之间所有观测值,没有分隔线list jdt? in 1/8 ,sep(0)//显示前
阅读全文
摘要:1.当一条样本的全部变量均与另一条或多条样本重复时,直接使用duplicates drop _all, force 或gduplicates drop _all, force,后者为外部命令,在样本较大时对运算速度的提升非常明显。 2.当一条样本的部分变量与另一条或多条样本重复时,需要 (a) 判断
阅读全文
摘要:(一)help missing Stata中共有23个类型的数值型缺漏值: . 为系统缺漏值;.a, .b, .c, ..., .z,为扩展缺漏值。 数值型缺漏值大于一切自然数,即”非缺漏值<.<.a<.b<…<.z” 。 因此,表达式age > 60为真,代表年龄变量取值大于60或是缺漏值。 li
阅读全文
摘要:我们在做数据清理时经常会遇到字符型变量的清理问题,Stata提供了大量、功能强大的字符函数,灵活运用字符函数可以高效、快速、精确、准确地清理数据。本文为大家介绍一些常用的Stata 字符函数。其中s 代表字符集,包括字符串、字符型变量或者其他字符表达式,n 代表数值子表达式,包括数字、字符型变量或者
阅读全文
摘要:2.1 圆括号与批量重命名 rename (old1 old2 ...) (new1 new2 ...) [,options] 将需要批量重命名的变量放置在第 1 对圆括号中,新的变量名放置在第 2 对圆括号中,这个操作方法比较简单粗暴,主要有以下几种应用场景: * 将 stat 重命名成 stat
阅读全文
摘要:cd "d:\statashu"// use cfps2020person_202112,clear// use cfps2018person_202012,clearuse momshs,clearlist// + +// | famid age race hs |// | |// 1. | 3
阅读全文
摘要:// 在Stata内安装外部包:estout和logout//estout标准化格式输出// ssc install estout// ssc install logoutssc install des2// checking des2 consistency and verifying not a
阅读全文
摘要:变量名称 基本规则:由英文字母、数字或者_组成;需以英文字母或者_作为开头,区分大小写。 举例合理名称:a1 ,a_1,_a1 注意事项:“_”一般不作为首字母(因许多内部变量由“_”加字母组成,避免混淆) 2.查看资料命令 describe(可简写为des):查看所有变量的结构,如何时建立数据库,
阅读全文
摘要:outsheet using "$dirLink/analysis.csv", replace comma //如果有同名直接覆盖,形成逗号分隔文件
阅读全文
摘要:1.变量的存储类型 清楚变量的取值区间后设定数据存储的类型,可以降低Stata内存容量。 ①整数的存储类型 Byte,字节型,取值±100 Int,一般整数型,取值±32000 Long,长整数型,取值±2.14*10^10 ②小数的存储类型 Float,浮点型,8位有效数字,是Stata默认的存储
阅读全文
摘要:use dentlab ,clear//将dentlab.dta读入内存,如果原内存已经打开其他文件直接清除 list // + +// | name years fulltime recom |// | |// 1. | Y. Don Uflossmore 7.25 part time recom
阅读全文
摘要:use dentistsfdasave mydent ,replace//replace选项如果新形成文件有同名存在直接覆盖 保存为SAS XPORT文件,扩展名为.xpttype mydent.xptlistduplicates list recom//有一变量名为recom,显示其重复的值列出来
阅读全文
摘要:"窗口"-do文件编辑器
阅读全文
摘要:增加一个序列编号,假设这个变量名为seqid,可使用下列命令找出数据中编号不连续的地方sort seqidlist seqid if seqid !=(seqid[_n-1]+1) in 2/L// list//// + +// | name years fulltime recom seqid |
阅读全文
摘要:use dentlab// 保存逗号或制表符分隔符的文件// 打开dentlab.dtaoutsheet using dentists_tab.out ,replace// 将当前文件导出为dentists_tab.out,如果有同名直接覆盖,默认形成制表符分隔文件type dentists_tab
阅读全文
摘要:总结前一天内容:dir 指定.dta 显示指定文件大小,即所需内存大小sep(0)无分隔线 in 5/18显示5-18记录,abb(20)所有变量都不能缩小到小于20个字符sepby(kidid)根据变量kidid分组,每组有分隔线(仍保持原有顺序,只是相邻的kidid相同的集中为一组,并用分隔线分
阅读全文
摘要:1.安装时选择StataMP2.选择 use each user's document folder3.复制 粘贴 覆盖 补丁4.第一次运行:选择“禁止自动更新检查”,取消“在检查更新之前始终提示”5.改变当前目录: 文件--更改工作目录,指定想要改成的文件夹 cd "d:\statashu" 连接
阅读全文

浙公网安备 33010602011771号