Variables”对话框中,选中欲修改的变量(图1-17),可以修改变量名、标签、变量类型以及测量水平等。4.建立数据集的子集【实验1-8】查找观测,并建立子数据集。下述方法可以找出所有男生的观测,并建立子数据集:(I)选择主菜单“Edit”→“Observations”→“Find”,打开“FindPindubuervatianaACLASSValueTeatObservations”对话框。(2)在变量名称列表中选择sex,在Value(值)列表中选择M,单击“OK”按钮,如图1-18所示;数据窗口中所有男生的观测被Appl选中,如图1-19左所示。(3)单击数据窗口左上角处的三角按钮,打开菜单,选择图1-18选择观测“Extract”,生成新数据集,如图1-19右所示。(4)若要保存数据集,选择菜单“File”→“Save”→“Data"”,在打开的“SaveData”对话框中选择保存的逻辑库名,并输入数据集名,单击“OK”按钮即可。ASASUSER.CLASS口区SASUSER.CLASSI口区图1-19建立数据集的子集四、在“分析家”中对数据的预处理选择主菜单“Solutions(解决方案)”→“Analysis(分析)”→“Analyst(分析家)”打开“Analyst:(newproject)”窗。选择主菜单“File(文件)”→“OpenBySASName”,打开“SelectAMember”对话框,选择数据集Sasuser.Class,单击“OK”后,打开的数据集就作为项目的一个成员,如图1-20所示。选择主菜单“Edit(编辑)”→“Mode(模式)”,→“Edit(编辑)”,将“Browse”模式改为“Edit”模式。注意:在“Edit(编辑)”模式下才可以对数据进行各种处理。Splect Alubnr+geep(eprnine迎迎国鱼aldCancerEBoteeaber sne:ClaiDataTableeCTatenber Type:图1-20SelectAMember(选择成员)8
8 Variables”对话框中,选中欲修改的变量(图 1-17),可以修改变量名、标签、变量类型以及 测量水平等。 4. 建立数据集的子集 【实验 1-8】查找观测,并建立子数据集。 下述方法可以找出所有男生的观测,并建立子数据集: (1) 选择主菜单“Edit”→“Observations”→“Find”,打开“Find Observations”对话框。 (2) 在变量名称列表中选择 sex,在 Value(值)列表中选择 M, 单击“OK”按钮,如图 1-18 所示;数据窗口中所有男生的观测被 选中,如图 1-19 左所示。 (3) 单击数据窗口左上角处的三角按钮,打开菜单,选择 “Extract”,生成新数据集,如图 1-19 右所示。 (4) 若要保存数据集,选择菜单“File”→“Save”→“Data”,在打开的“Save Data”对 话框中选择保存的逻辑库名,并输入数据集名,单击“OK”按钮即可。 图1-19 建立数据集的子集 四、在“分析家”中对数据的预处理 选择主菜单“Solutions(解决方案)”→“Analysis(分析)”→“Analyst(分析家)”打 开“Analyst:(new project)”窗口。 选择主菜单“File(文件)”→“Open By SAS Name”,打开“Select A Member”对话框, 选择数据集 Sasuser.Class,单击“OK”后,打开的数据集就作为项目的一个成员,如图 1-20 所示。 选择主菜单“Edit(编辑)”→“Mode(模式)”,→“Edit(编辑)”,将“Browse”模式 改为“Edit”模式。注意:在“Edit(编辑)”模式下才可以对数据进行各种处理。 图1-20 Select A Member(选择成员) 图1-18 选择观测
1.对数据集排序【实验1-9】在“分析家”中对数据集排序。SortCann对数据集排序的方法如下:s(1)在编辑模式下,选择菜单“Data(数据)”D→“Sort(排序)”,打开“Sort(排序)”对话框。(2)选中欲排序的变量名,单击“SortBy”CArendZuecgend按钮,将排序变量选入右框,可选多个变量。(3)在右列表框中,选中排序变量,单击图1-21“Sort(排序)”对话框“Ascend/Descend”按钮可以在升序或降序之间切换。图1-21所示为按name进行升序(A)排列。2.创建新的变量【实验1-10】在“分析家”中对数据集添加新的变量。在编辑模式下,对数据集有两种方式添加新的变量。●直接插入变量:选择菜单“Edit区Compute:Class(编辑)”→“InsertColumns(插入列)”OK.nevRecall→“Character”或“Numeric”,一一指定Cancel(height + weight) / age]四插入变量的类型一一即可在数据集中插ResetAHelp国入一个新的变量。AttributesVerityAA?由原变量计算得到新变量:Yartabl.e7Category:Arithaetic当品Cnane选择菜单“Data(数据)”-C.sex“Transform(变换)”→“Compute(计算)”,打开“Compute(计算)”对话框:在对话框中确定变量关系式,如:加入一个名为new的数值型变量,等于(height+weight)/age,如图1-22所示。图1-22“Compute(计算)”对话框单击“OK”按钮后,数据集中增加了一个新变量:new。3.在数据集中增加新观测【实验1-11】在“分析家”中对数据集添加新的观测。在编辑模式下,选择菜单“Edit(编辑)”→“AddRows(增加行)”,在数据集最后增加一条空观测。填入数据后,存盘即可。4.创建数据集的子集【实验1-12】在“分析家”中创建数据集的子集。(I)打开一个数据集后,在编辑模式下,选择菜单“Data(数据)”→“Filter(过滤)”→“SubsetData(子集数据)”,打开“Subset”对话框;在列表中选择变量,如选中变量“age”,在弹出的“Operators(算子)”列表中选择算子(比如GE表示“大于等于”),如图1-23左所示。9
9 1. 对数据集排序 【实验 1-9】在“分析家”中对数据集排序。 对数据集排序的方法如下: (1) 在编辑模式下,选择菜单“Data(数据)” →“Sort(排序)”,打开“Sort(排序)”对话框。 (2) 选中欲排序的变量名,单击“Sort By” 按钮,将排序变量选入右框,可选多个变量。 (3) 在右列表框中,选中排序变量,单击 “Ascend/Descend”按钮可以在升序或降序之 间切换。图 1-21 所示为按 name 进行升序(A)排列。 2. 创建新的变量 【实验 1-10】在“分析家”中对数据集添加新的变量。 在编辑模式下,对数据集有两种方式添加新的变量。 ● 直接插入变量:选择菜单“Edit (编辑)”→“Insert Columns(插入列)” →“Character”或“Numeric”,——指定 插入变量的类型——即可在数据集中插 入一个新的变量。 ● 由原变量计算得到新变量: 选 择 菜 单 “ Data ( 数 据 )” → “Transform(变换)”→“Compute(计 算)”,打开“Compute(计算)”对话框; 在对话框中确定变量关系式,如:加入 一个名为 new 的数值型变量,等于 (height + weight)/age,如图 1-22 所示。 单击“OK”按钮后,数据集中增加 了一个新变量:new。 3. 在数据集中增加新观测 【实验 1-11】在“分析家”中对数据集添加新的观测。 在编辑模式下,选择菜单“Edit(编辑)”→“Add Rows(增加行)”,在数据集最后增加 一条空观测。填入数据后,存盘即可。 4. 创建数据集的子集 【实验 1-12】在“分析家”中创建数据集的子集。 (1) 打开一个数据集后,在编辑模式下,选择菜单“Data(数据)”→“Filter(过滤)”→ “Subset Data(子集数据).”,打开“Subset”对话框;在列表中选择变量,如选中变量“age”, 在弹出的“Operators(算子)”列表中选择算子(比如 GE 表示“大于等于”),如图 1-23 左所 示。 图1-21 “Sort(排序)”对话框 图1-22 “Compute(计算)”对话框
LOX口区Operatorodscbokup dtstinctpgalues)MelpCostFesetCancelSex'Eo图1-23“Subset”对话框(2)用鼠标单击列表框中的“<LOOKUPdistinctvalues>”(图1-23右),再在弹出的"LookupValues”对话框中选择变量age的可能取值,如找出所有年龄大于等于13的观测,可选值为13。(3)单击“OK”按钮,即可生成子集,如图1-24所示。Analyst: (new project)口口XClas(dit)there ageCE 13New Project:nanesexheightveightagc白ClassAnalysis13alice56.584class1365,398Becka90Gail1464.3白Compute1O11266. 5ary国Code1562.5112.5Sharon62. 8ComputeTaany102.5146112.510AlfredLCode63.5Duke102.5白ComguteGuido156713312.841062.5LCode14Jeffrey150Philip167216白Compute166.5112villiar国Code4P图1-24生成所有age大于等于13的观测若要保存新生成的子集,可以选择菜单“File(文件)”→“SaveAsBySASName(另存为SAS文件)”,取名后单击“Save”即可。若想恢复数据集的所有观测,可以选择菜单“Data(数据)”→“Filter(过滤)”→“None(无)”,即可解除“过滤”。5.由数据集随机抽样【实验1-13】在“分析家”中对数据集随机抽样。在编辑模式下,选择菜单“Data(数据)”→“RandomSample(随机抽样)”,在打开的“RandomSample”对话框中,可设定样本的容量(Rows)或抽取的比例(Ratio)以及种子(Seed)。例如,图1-25左所示即为创建一个容量为10的样本时的设置。单击“OK”按钮,即可生成所需样本,如图1-25右所示。10
10 图1-23 “Subset”对话框 (2) 用鼠标单击列表框中的“<LOOKUP distinct values>”(图 1-23 右),再在弹出的“Lookup Values”对话框中选择变量 age 的可能取值,如找出所有年龄大于等于 13 的观测,可选值为 13。 (3) 单击“OK”按钮,即可生成子集,如图 1-24 所示。 图1-24 生成所有age大于等于13的观测 若要保存新生成的子集,可以选择菜单“File(文件)”→“Save As By SAS Name(另存 为 SAS 文件)”,取名后单击“Save”即可。若想恢复数据集的所有观测,可以选择菜单“Data (数据)”→“Filter(过滤)”→“None(无)”,即可解除“过滤”。 5. 由数据集随机抽样 【实验 1-13】在“分析家”中对数据集随机抽样。 在编辑模式下,选择菜单“Data(数据)”→“Random Sample(随机抽样)”,在打开的 “Random Sample”对话框中,可设定样本的容量(Rows)或抽取的比例(Ratio)以及种子 (Seed)。例如,图 1-25 左所示即为创建一个容量为 10 的样本时的设置。 单击“OK”按钮,即可生成所需样本,如图 1-25 右所示
BOXRandam SamfClTablple:CleTaNeEexheightveightSourcedataageCuido6713315RONS:19156.880OBKaren25T.3Jaaes.Cancel1856.5Alice-Randon waple172PhilipReset102.5Rows:10N63.5Duke414HelpMaryT53址D66.5Ratioi53A62.5Jeffrey"62.BTaany1Seed:VOA8John105.图1-25随机抽样若要保存生成的样本,可以选择菜单“File(文件)”→“SaveAsBySASName(另存为SAS)"6.增加已知分布的随机变量【实验1-14】在“分析家”中对数据集增加已知Gencrate Random Variates fros a Normal Dist...分布的随机变量。Mornall]New colunn nane:在编辑模式下,选择“Data(数据)”→“RandomParaaeteVariates(随机变量)”,在下级菜单中选择一个分布,Tean:Standard deviation:如“Normal(正态分布)”,在弹出的对话框中填入变量名和正态分布的两个参数Mean(均值)和StandardOKCancelHelpdeviation(标准差),如图1-26所示,单击“OK”即可增加一个随机变量。图1-26增加随机变量1.4上机演练【练习1-1】在INSIGHT中对数据集SASUSER.CLASS进行预处理(1)对数据集排序;(2)在数据窗口中移动列;(3)修改标签名;(4)创建新的变量;(5)建立数据集的子集。【练习1-2】在“分析家”中对数据集SASUSER.CLASS进行预处理(1)改变数据集的编辑方式:(2)对数据集排序:(3)创建新的变量;(4)追加和删除数据集中的观测:(5)建立数据集的子集;(7)由数据集随机抽样。11
11 图1-25 随机抽样 若要保存生成的样本,可以选择菜单“File(文件)”→“Save As By SAS Name(另存为 SAS)”。 6. 增加已知分布的随机变量 【实验 1-14】在“分析家”中对数据集增加已知 分布的随机变量。 在编辑模式下,选择“Data(数据)”→“Random Variates(随机变量)”,在下级菜单中选择一个分布, 如“Normal(正态分布)”,在弹出的对话框中填入变量 名和正态分布的两个参数 Mean(均值)和 Standard deviation(标准差),如图 1-26 所示,单击“OK”, 即可增加一个随机变量。 1.4 上机演练 【练习 1-1】在 INSIGHT 中对数据集 SASUSER.CLASS 进行预处理. (1) 对数据集排序; (2) 在数据窗口中移动列; (3) 修改标签名; (4) 创建新的变量; (5) 建立数据集的子集。 【练习 1-2】在“分析家”中对数据集 SASUSER.CLASS 进行预处理. (1) 改变数据集的编辑方式; (2) 对数据集排序; (3) 创建新的变量; (4) 追加和删除数据集中的观测; (5) 建立数据集的子集; (7) 由数据集随机抽样。 图1-26 增加随机变量
1.5实验报告请按练习内容写出包括如下内容的实验报告:一、实验目的;二、实验内容及结果;三、实验中存在的问题及解决方法;四、实验体会(结论、评价、感想与建议等)。12
12 1.5 实验报告 请按练习内容写出包括如下内容的实验报告: 一、实验目的; 二、实验内容及结果; 三、实验中存在的问题及解决方法; 四、实验体会(结论、评价、感想与建议等)