Stata笔记北京科技大学

发布时间 : 星期一 文章Stata笔记北京科技大学更新完毕开始阅读

改颜色edit-preference-general prefernce-classic

下面命令框-右键-font-改字号

命令cd d:\\ 改到d盘(change directory) dir查询d盘有什么

sysuse auto 系统自带汽车数据,数据变量(字段)显示在右上角 br(owse) 浏览数据(字符型红色,数值型黑色,蓝色-右键-value labels-hide all labels标签隐藏)

h(elp) li(st) 告诉你命令怎么用,下面有例子 左边双击执行,单击复制到命令框 order price mpg(单击右边的变量)

order make-foreign 改变变量顺序,从make到foreign

g(enerate) new=rep78-trunk 输出新变量(rep78,trunk是字段,可单击选择,\表示缺省,加减乘除+-*/)

list if new==14 (==为等于,=为赋值,可以点击more) li(st) if new2>=14 & new2<24 (按q可以退出,即quit) replace new3=rep78 (输错了替换) drop new new2 new3删除变量 list if new>10000

list make if new<10000|new>2000 (竖线表示或者,回车上面那个) !=表示不等于

左边命令,右键save

save data 文件名为data sysuse auto preserve reserve

save auto2 保存时不需加后缀,删除时带后缀.dta sort price从小到大

gsort price 都可以,比较随意

gsort -trunk price (默认加号,为排序) order make new (将new排到第二位) aorder (alphabetic 按字母顺序排序) disp(lay) sin(1) 作为计算器使用 ln以e为底

----------------3.13--------- 锐思数据库选择数据

-----非金融行业负债表---- 左边-财务报表-非金融行业 合并标识-1合并报表 调整标识-1

报表类型-q4、信息来源-q4 公司类别-20-定期报告 信息来源:q4 a股股票代码

截止日期

流动资产合计 应收账款 总资产

流动负债合计 负债合计

所有者权益合计

------非金融行业利润表--- 前同 净利润 营业收入

excel输出(默认)选择列表签+列名 ------打开STATA------

file-import-xls菜单引入文件 clear可清除数据

varible name 不识别中文

选中第一个import first row as varible names

第二个import all data as strings意思是将数据看作字符型(不选) br(ouse)展示数据

流动比率=流动资产/流动负债 资产负债率=总负债/总资产

产权比率=总负债/所有者权益合计 mkdir d:\\hsy1\\mydata 建立文件夹 cd d:\\hsy1\\mydata 基于文件夹 dir 显示文件夹

save bs 保存数据,名为bs

直接运行是双击,显示在框内为单击

g(enerate) currrate=Totcurass/Tutcurlia 流动比率(等号后面点右上方variables) 显示(8 missing values generated)有八个缺失值 g lev=Totlia/Totass 负债率leverage

g pright= Totlia/ TotSHE 产权比率porperty save bs2 另存数据 drop 为删除变量

clear从内存删掉,不会从硬盘删掉 ------利润表----- import save is

g incorate= Netprf/ Incmope 利润率=净利润/营业利润 save is2 ---- clear

use bs2 打开bs2

g year=year( EndDt) 。year(EndDt)表示从变量EndDt里把年份取出,如month() g month=month( EndDt) save bs3

----- clear . use is2

. g year=year( EndDt) . g month=month( EndDt) . save is3

----合并merge横向1对1合并,append纵向合并---

merge 1:1 A_Stkcd year using bs3注意后面的两个变量名字在原来两个表里是相同的,将bs3合并到现在(is3)中 错误类型variables A_Stkcd year do not uniquely identify observations in the master data

而master data指主数据库,using data 从数据库 (替换变量名Stked 改成A_Stked)rep A_Stked Stked (替换原数据is3)save is3,replace clear 清除合并 use bs3

duplicates report A_Stkcd year 报告重复的变量(两个) 显示(surplus为多余的)

copies | observations surplus ----------+--------------------------- 1 | 17017 0 21 | 21 20 22 | 110 105 23 | 46 44 --------------------------------------

duplicates drop A_Stkcd year,force 同一公司同一年数据删掉,强制删除 save bs4

(is, bs都除重就可以合并了)

keep if _merge==3(3为完全匹配,1,2不完全匹配) drop if _merge!=3 如果不完全匹配去除 . save bsis

-------------------------- 300创业板(最小) 002中小板 000主板

keep if substr( A_Stkcd,1,3)==\筛选,substr()为取字符串函数,从第一位开始取取3位,加引号为字符型

summerize Totass 看Totass的各种指标,标准差,最大最小值 su Totass,detail 可以看到上下四分位 截尾,去掉两端1%左右的值

缩尾,将99%以后的数值以99%的数值替代,去除极端值,1%一下同理 su Totlia,d(etail)

su Accrecv-pright 逐个显示变量的信息

corr(elation) Totass Totlia 相关性分析,0.3一下不相关,0.3-0.5低度相关,0.5-0.8中度相关

pwcorr Totass Totlia 偏相关 pwcorr Totass Totlia Totcurrass,sig star(0.05) 显着性水平significance,小于0.05的标星号,星号在它上面 ------------

导出,file-export

------------------------------------3.20---------------------------------- reg 因变量(因变量:被解释变量;自变量:解释变量) set linesize 140加宽显示窗格

reg price rep78 headroom trunk weight (std. err.=standard error,T值,confidence interval置信区间)

P与T反向关系,标准误=T值

adjusted r-square调整的r方(自变量越多r方越大) *表示P<10%,>5% **表示P<5%,>1% ***表示P<1%

DF 自由度,degree of free ttest rep78=headroom。t检验

做散点图scatter length price。命令是scatter line 变量名1 变量名2 折线图 hist 变量名1 变量名2。做直方图 histogram 柱状图 hist 变量名,freq

hist 变量名,addl freq

--------------------3.27--------------------

将家庭记为househood,个人记为people,收入记为income。输入命令:egen income_people=mean(income),by(househood)就可以了! egen newvar= ma(y), nomiss t(7)

即建立一个新变量,等于跨距为7的y的移动平均数,用较短、未对中的平均数取代起点值和终点值。

g y=year( EndDt) 提取年份

. order CompanyCode y 将公司代码排第一列,年份排第二列 help reshape

reshape wide Incmope- InventoryTurnoverRatio,i( CompanyCode) j( y)一定在i和前面有逗号!

. g Accrecv2009mean=( Accrecv2009+ Accrecv2008)/2 reshape long .....,

----------4.17---------------

destring 变量名,replace 使字符型变数值型

g y=real(substr( Accper,1,4)) 从字符型取年份,并变成数值型,从左向右取四位 . drop Accper

. order Stkcd y 按变量1,变量2 排序 . keep if y==2000|y==2001

. g infee=ln( Tcost) 对Tcost取对数产生infee变量 . drop Tcost

g brandname=1 if substr( Dadtunit,1,4)==\普华\

联系合同范文客服:xxxxx#qq.com(#替换为@)