Stata软件基本操作和数据分析入门 第一讲 Stata操作入门 张文彤赵耐青 第一节概况 Stata最初由美国计算机资源中心( Computer Resource Center) 研制,现在为Stat公司的产品,其最新版本为7.0版。它操作灵活、 简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越 受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大 权威统计软件。 Stata最为突出的特点是短小精悍、功能强大,其最新的70版整 个系统只有10M左右,但已经包含了全部的统计分析、数据管理和 绘图等功能,尤其是他的统计分析功能极为全面,比起1G以上大小 的SAS系统也毫不逊色。另外,由于Stat在分析时是将数据全部读 入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。 由于Sata的用户群始终定位于专业统计分析人员,因此他的操 作方式也别具一格,在 Windows席卷天下的时代,他一直坚持使用 命令行/程序操作方式,拒不推出菜单操作系统。但是, Stata的命 令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理, 它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可 以使用相同功能的选项,这使得用户学习时极易上手。更为令人叹服 的是, Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充 分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲
Stata 软件基本操作和数据分析入门 第一讲 Stata 操作入门 张文彤 赵耐青 第一节 概况 Stata 最初由美国计算机资源中心(Computer Resource Center) 研制,现在为 Stata 公司的产品,其最新版本为 7.0 版。它操作灵活、 简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越 受到人们的重视和欢迎,并且和 SAS、SPSS 一起,被称为新的三大 权威统计软件。 Stata 最为突出的特点是短小精悍、功能强大,其最新的 7.0 版整 个系统只有 10M 左右,但已经包含了全部的统计分析、数据管理和 绘图等功能,尤其是他的统计分析功能极为全面,比起 1G 以上大小 的 SAS 系统也毫不逊色。另外,由于 Stata 在分析时是将数据全部读 入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。 由于 Stata 的用户群始终定位于专业统计分析人员,因此他的操 作方式也别具一格,在 Windows 席卷天下的时代,他一直坚持使用 命令行/程序操作方式,拒不推出菜单操作系统。但是,Stata 的命 令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理, 它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可 以使用相同功能的选项,这使得用户学习时极易上手。更为令人叹服 的是,Stata 语句在简洁的同时又拥有着极高的灵活性,用户可以充 分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲
除了操作方式简洁外, Stata的用户接口在其他方面也做得非常简 洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使 得 Stata成为非常适合于进行统计教学的统计软件。 Sata的另一个特点是他的许多高级统计模块均是编程人员用其 宏语言写成的程序文件(ADO文件),这些文件可以自行修改、添加 和下载。用户可随时到Staa网站寻找并下载最新的升级文件。事实 上, Stata的这一特点使得他始终处于统计分析方法发展的最前沿, 用户几乎总是能很快找到最新统计算法的St程序版本,而这也使 得 Stata自身成了几大统计软件中升级最多、最频繁的一个。 由于以上特点, Stata已经在科研、教育领域得到了广泛应用, wHO的研究人员现在也把 Stata作为主要的统计分析工作软件 第二节 Stata操作入门 、 Stata的界面 图1即为Staa70启动后的界面,除了 Windows版本的软件都 有的菜单栏、工具栏,状态栏等外, Stata的界面主要是由四个窗口 构成,分述如下: 1.结果窗口:位于界面右上部,软件运行中的所有信息,如所执 行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同 的颜色区分不同的文本,如白色表示命令,红色表示错误信息。 2.命令窗口:位于结果窗口下方,相当于DOS软件中的命令行, 此处用于键入需要执行的命令,回车后即开始执行,相应的结果则会 在结果窗口中显示出来
除了操作方式简洁外,Stata 的用户接口在其他方面也做得非常简 洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使 得 Stata 成为非常适合于进行统计教学的统计软件。 Stata 的另一个特点是他的许多高级统计模块均是编程人员用其 宏语言写成的程序文件(ADO 文件),这些文件可以自行修改、添加 和下载。用户可随时到 Stata 网站寻找并下载最新的升级文件。事实 上,Stata 的这一特点使得他始终处于统计分析方法发展的最前沿, 用户几乎总是能很快找到最新统计算法的 Stata 程序版本,而这也使 得 Stata 自身成了几大统计软件中升级最多、最频繁的一个。 由于以上特点,Stata 已经在科研、教育领域得到了广泛应用, WHO 的研究人员现在也把 Stata 作为主要的统计分析工作软件。 第二节 Stata 操作入门 一、Stata 的界面 图 1 即为 Stata 7.0 启动后的界面,除了 Windows 版本的软件都 有的菜单栏、工具栏,状态栏等外,Stata 的界面主要是由四个窗口 构成,分述如下: 1.结果窗口:位于界面右上部,软件运行中的所有信息,如所执 行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同 的颜色区分不同的文本,如白色表示命令,红色表示错误信息。 2.命令窗口:位于结果窗口下方,相当于 DOS 软件中的命令行, 此处用于键入需要执行的命令,回车后即开始执行,相应的结果则会 在结果窗口中显示出来
3.命令回顾窗口:即 review窗口,位于界面左上方,所有执行 过的命令会依次在该窗口中列出,单击后命令即被自动拷贝到命令窗 口中;如果需要重复执行,用鼠标双击相应的命令即可。 4.变量名窗口:位于界面左下方,列出当前数据及中的所有变量 名称,。 除以上四个默认打开的窗口外,在Sata中还有数据编辑窗口 程序文件编辑窗口、帮助窗口、绘图窗口、Lg窗口等,如果需要使 用,可以用 Window或Help菜单将其打开 x 命令 口9 回顾 窗口 变量名窗口 果窗 图1 Stata70启动后的界面 命令窗口 二、数据的录入与储存 Stat为用户提供了简捷,但是非常完善的数据接口,熟悉它的用 法是使用 Stata的第一步,在 Stata中读入数据可以有三种方式:直 接从键盘输入、打开已有数据文件和拷贝、粘贴方式交互数据 1)从键盘输入数据 在 Stata中可以使用命令行方式直接建立数据集,首先使用 input 命令制定相应的变量名称,然后一次录入数据,最后使用end语句
3.命令回顾窗口:即 review 窗口,位于界面左上方,所有执行 过的命令会依次在该窗口中列出,单击后命令即被自动拷贝到命令窗 口中;如果需要重复执行,用鼠标双击相应的命令即可。 4.变量名窗口:位于界面左下方,列出当前数据及中的所有变量 名称,。 除以上四个默认打开的窗口外,在 Stata 中还有数据编辑窗口、 程序文件编辑窗口、帮助窗口、绘图窗口、Log 窗口等,如果需要使 用,可以用 Window 或 Help 菜单将其打开。 图 1 Stata 7.0 启动后的界面 二、数据的录入与储存 Stata 为用户提供了简捷,但是非常完善的数据接口,熟悉它的用 法是使用 Stata 的第一步,在 Stata 中读入数据可以有三种方式:直 接从键盘输入、打开已有数据文件和拷贝、粘贴方式交互数据。 1)从键盘输入数据 在 Stata 中可以使用命令行方式直接建立数据集,首先使用 input 命令制定相应的变量名称,然后一次录入数据,最后使用 end 语句 命令窗口 结果窗 口 命 令 回 顾 窗口 变量名窗口
表明数据录入结束。 例1在某实验中得到如下数据,请在 Stata中建立数据集 观测数据 X13579 Y246810 解:此处需要建立两个变量X、Y,分别录入相应数值,St中 的操作如下,其中划线部分为操作者输入部分。 drop all input 2. 4.78 5.910 6. end 2)用 stata的数据编辑工具 ①进入数据编辑器 进入 stata界面,在命令栏键入edit或在 stata的 window下 拉菜单中单击 data edito减或点击编辑图标注意:回是浏览 图标,点击后只能浏览,不能编辑师可进入 stata数据编辑器 ( stata界面如下图2)
表明数据录入结束。 例 1 在某实验中得到如下数据,请在 Stata 中建立数据集。 观测数据 X 1 3 5 7 9 Y 2 4 6 8 10 解:此处需要建立两个变量 X、Y,分别录入相应数值,Stata 中 的操作如下,其中划线部分为操作者输入部分。 . drop _all . input x y x y 1. 1 2 2. 3 4 3. 5 6 4. 7 8 5. 9 10 6. end 2)用 stata 的数据编辑工具 ①进入数据编辑器 进入 stata 界面,在命令栏键入 edit 或在 stata 的 window 下 拉菜单中单击 data editor 或点击编辑图标 (注意: 是浏览 图标,点击后只能浏览,不能编辑)即可进入 stata 数据编辑器。 (stata 界面如下图 2)
到删s 图2 ②数据编辑 stata数据编辑器界面:此时进入了数据全屏幕编辑状态。 囝回画圆圈回圈固型口回e 奥刑。2會回 图3 在第一列输入数据后, Stata第一列自动命名为var1;在第二列输 入数据后,第二列自动命名为var2……依次类推。在输入数据后, 双击纵格顶端的变量名栏(如:Var1或var2处),可以更改变量名
图 2 ②数据编辑 stata 数据编辑器界面:此时进入了数据全屏幕编辑状态。 图 3 在第一列输入数据后,Stata 第一列自动命名为 var1;在第二列输 入数据后,第二列自动命名为 var2……依次类推。在输入数据后, 双击纵格顶端的变量名栏(如:Var1 或 Var2 处),可以更改变量名