sPsS犍计发用实夺 3.整群抽样法 (cluster sampling:如果样本所属母群体的很大或涵括的地理位置很广,则 采用整群抽样法较为简宜。整群抽样法是以一个群组 cluster)或一个团体为抽取单位, 而不以个人为取样单位,因而整群抽样法时,抽取的样本点是一个群组、一个群组, 群组与群组间的特征非常接近,同构型很高:而群组内彼此成员的差异较大,异质性 高。在社会科学领域中,整群抽样的群组如班级、学校、组别、部门、学区等。 整群抽样的步骤如下 ①确认与界定母群体。 ②决定研究所需的样本大小。 ③确认与定义合理的组群 ④列出母群体所包括的所有组群。 ⑤估计每个组群中平均母群成员的个体数 以抽取的样本总数除以组群平均个体数,以决定要选取的组群数目。 ⑦随机取样方式,选取所需的组群数。 ⑧每个被选取之组群中的所有成员即成为研究样本 整群抽样的图标如下: 母群体共分成M个集群 共抽取N个集群 集群 集群五 集群 集群二 集群六 集群三 体 集群三 集群四 集群M 集群N 样本选取时,最重要的是样本要有代表性,才能从受试样本群推论到其母群的性质,受 试样本要有代表性,最重要的方法就是要把握“随机取样”与“随机分派”两个原则。 此外,研究设计与数据处理时,应考虑到以下几个问题: 取样的样本要多少才算“够大 在研究设计中,受试者的数目要多大才算具有代表性,多少位样本才算“够大”(arge enough),这个议题,社会科学研究领域中,似乎无致结论。其中,学者 Sudman(1976 提出的看法,可供研究者参考。 Sudman认为: 1.初学者进行与前人相类似的研究时,可参考别人样本数,作为自已取样的 参考
第1章研完设计与量分折 2.如果是地区性的研究,平均样本人数在500至1000人之间较为适合:而如果是全 国性研究,平均样木人数约在1500人至2500人之间较为适宜 学者Gay(1992)对于样本数多少,则提出以下之看法: 1.描述研究( descriptive research)时,样本数最少占母样体的10%,如果母群体较小 则最小的样本数最好为母群体的20% 2.相关研究( correlational studies)的目的在于探究变量间的有无关系存在,受试者至少 须在30人以上 3.因果比较研究( causal- comparative studies)与许多实验研究,各组的人数至少要有 30位 4.如果实验研究设计得宜,有严密的实验控制,每组受试者至少在15人以上,但权 威学者还是认为每组受试者最少应有30人,最为适宜。 考虑研究实际情境与研究间差异,抽取样本时如局限于“绝对数量”多少,较为不宜, 因为各母群体性质不同,异质性很高,包含个体数差异也很大。所以可接受之受试样本 数准则只是一种参考指针,因为“如果取样方式不当,虽然选了很大的样本,代表性很 低,还不如以适当抽样的方法,选取有代表性的小样本” 学者Borg与Ga(1983)二者即认为,样本数多少受到多种变量的影响,在下列几种条件 或情境中,要采较人的样本数 L.编制之测量工具的“信度”(可靠性)较低时 2.研究进行中有较多变量无法控制时。 3.母群体的同构型很低时。 4.统计分析时,受试者须再细分为较小的各群组来分析比较时 5.实验设计时,预期会有较多受试者中途退出时。 变量属性是否正确界定? 不同变量属性,所适用的统计方法也不同,研究者对于变量的属性如何,应该能清楚掌 握,否则可能会误用统计力法。一个常见的例子是,多元回归分析的自变量与因变量均 应是“连续变量”,自变量如果是类别变量或次序变量应该先转换为虚拟变量 dummy variable),才能投入回归方程式,但部份研究者往往未将类别变量或次序变量转换,而 直接投入回归方程式中或预测变量中投入过多的类别或次序变星,这样的统计方法,虽 然结果也可以解释,但可能会造成结果解释的偏误。 数据分析之变量属性的分类屮,多采纳学者 Stevens(946、1951)的观点, Stevens的看法 中,乃根据测量量表或测量水准的基准,将变量属性类别划分成以下几种: 名义变量 (nominal variable或称类别变量 categorical variable) 主要在F分类对象,把对象转变为间断类别,变量主要属性只是用来辨识事物或表 示事物的类別而己,如性别、种族等 2.次序变量 ordinal variable) 变量除具有分类特性外,又具有等级排序关系。变量间根据某个准则,可将对象由 最高至最低作有规则的排序,变量主要属性在于可用数值表示对象间之优劣、多少 高低、次序等
sPSS计应用实务 ·垂·香●··s春非非·垂·.看··要 3.等距/比率变量( (interval/ratio variable) 等距变量除可表示对象类別及比较大小次序外,对象类别间距离是相等的,因而变 量间有“可加性”( additivity)。如果对象类别间存有绝对的零点( ogical zero points), 则称为比率变量,比率变量间有“可乘性”( multiplicativity),-者均属连续变量 (continuous variables 在社会科学领域中,学者不会特别在意等距变量与比率变量间划分,因为社会科学中 貞正的等距变量往往也是比率变量,如收入、年龄等:加上等距变量与比率变量所适用的统 计方法并无不同,二者均含有算术计算特性,因而两个变量常被合而为一,数据分析中,似 乎不必严格区分变量是属等距变量或比率变量 在社会科学中,常用的李克特式之多选项量表( multiple-item scales),严格说起来,量 表之变量性质是一种次序变量,但次序变量与名义变量均属“间断变量”( discrete variable),间断变量无法求其平均数、或进行相关、回归等统计分析,因而无法验证相关 的研究假设,所以多数研究者在编制多选项量表时,皆把量表视为等距变量来设计,此类 等距变量也可转化为不同类别,它虽然不是“真正”等距变量,但多假定具有真正等距变 量的性质,如此,才能进行有意义的数据统计分析与归纳出合理的结论 Bryman& Cramer, 此外,在社会科学领域中,另一个常见的变量为“二分变量”( dichotomous variables) 此变量被视为名义变量或次序变量,均属于间断变量,对象属性只分为二大类别,如“男” 女”:“及格”、“不及格”等。如果间断变量有三大类或三个水准时,则称为“二分变量” ( trichotomous variable),如包含三个类别以上或三个水准以上的间断变量,又称为“多分变量 (multichotomous variable) 在变量属性的转换上,等距/比率变量可转化为次序变量或名义变量,如依某一分量表 之得分高低,将样本分成“高分组”、“中分组”、“低分组”,但次序变量或名义变量不能转换 为等距变量/比率变量,如要转换,常用者为以虚拟变量方式出现(有关虚拟变量的转换与 应用,请参考多元回归分析一章) 彙表分析步骤 在问卷调查法( (questionnaire survey)或实验研究法( experimental method)屮,研究或调査L 具编制甚为重要,问卷如果编制或选用得宜,则研究才更具可靠性与价值性。本章先说明问 卷信效度分析的简要步骤,各步骤的操作方法则分别于以后各章节详细说明。 何卷信效度分析的步骤,简要分述如下 编拟预试问卷 在预试问卷的编制或修订上,应根据研究目的、相关文献数据与研究结构等方面加以 考虑,如果有类似的研究工具,可根据研究当时的实际情形,加以修订、增删:如果 是自己重新编制问卷,问卷內容应依据研究结构的层面,加以编制。在编制问卷时, 应注意:
第1章研究议计与量表析 1、如果问卷的题项内容过于敏感,应在问卷屮穿插数题“测谎题”,以探知填答者是否 据实填答 2.态度量表通常采用的是李克特式量表 (Likert-type Scale法,量表填答方式以4点量表 法至6点量表法,最为多人或研究者所釆用 对于应用几点量表法,学者 Birdie(1994)根据研究经验,综合提出以下看法,可供研 究者参考 1.充大多数的情况下,5点量表( points是最可靠的,选项超过5点,一般人难有足够的 辨别力。 2.3点量表限制了温和意见与强烈意见的表达,五点量表则好可以表示温和意见与强 烈意见之间的区别。 3.由于人门变量的异质性关系,对于没有足够辨别力的人而言,使用7点量表法,会导 致信度的丧失;对于具有足够辨别力的人而言,使用5点量表,又令人有受限的不适 感,以上问题至目前还没有一个很好解释理由,然而透过预试( pretesting),可以发现 这些问题的存在 4.量表的点数愈多,选答分布的情形就愈广,变异数也会变得更大,有些人认为这种情 形在统计检验上会具有很好的区别力,然而,(1)这种选答很广的分布缺乏可信度 故完全没有意义;(2)较大的选答变异数,表示也会有较大的抽样误差,就统计数据 分析的意义而,是不该有太大的变异数的彭仁信,民83) 李克特式量表法,重视其“内在一致性程度”,这是量表题项两两之间关系强度的函数, 也是题项与潜在变量间的关系指针,函数值大小与题项数多寡有密切关系,题项数愈多, 愈有可能涵括所要测量的潜在变量;不过,题项数过多,在实际妍究情境屮多数会有实 际的困难,如受试者时间不允许或造成填答者不用心作答等。学者 De vellis(99)对于预 试问卷题项数提出以下两点看法,可作为研究者参考: 1.如果研究者是编制或发展一个正式的测验或量表,作为其它心理测量之用,则预试题 项数最好是将来所需正式题项总数的3-4倍 2.在某些特定内容范围中,有些量表题项的发展不容易;或先前相关的研究显示,这些 设想不需要过多的题项即可获得良好的内在一致性,预试量表的题项数约为正式量表 题项数的1.5倍即可,如正式量表题项数预计在20题附近,则预试问卷时,其预试 题项数大约为30题 预试 预试问卷编拟完后,应实施预试,预试对象的性质应与将米正式问卷要抽取的对象性质 相向,如研究对象为中学生,则预试之受试者也应为中学生,预试对象人数以问卷中包 括最多题项之“分量表”的3-5倍人数为原则,如调查预试问卷中,包括三种分量表, 每种分量表包含的题项分别为40题、35题、25题,则预试对象,最好在120位全200 位中间,如果样本较为特殊,在预试人数的选取上叮考虑再酌减一些。 预试时选取样本数应该多大最为适宜?应考虑问卷量表是否进行因素分析(因素分析相 关内容请参考第3章)。因为因素分析时,以较大样本分析所呈现的因素组型 factor pattern),比一个只用较小样本所出现的因素组型,要来得稳定。进行因素分析时,量表
SPSS鏡计应用实务 番。垂酯。。曲鲁。香看曲自鲁鲁·番。曲。看鲁鲁。要 的题项数愈多及预期要有较多的因素层面的话,进行因素分析时,应包括愈多的受试者 ( De vellis,1991)。学者 Tinsley和 Tinsley(1987)建议,进行因素分析时,每个题项数与预 试样本数的比例大约为1:1至1:10之间,如果受试者总数在300人以上时,这个比 例便不是那么重要。最近,另一学者 Comrey(988)也提出另一观点,如果量表的题项数 少于40题,中等样本数约是150位,较佳的样本数是200位。其观点与 Tinsley二者接 近,亦即量表题项数与预试人数比例约为1:1最为适合。 整理问卷与编号 问卷回收后,应一份一份检查筛选,对于数据不全或不诚实填答之问卷,应考虑将之删 除:对于填答时皆填同一性答案者,是否删除,研究者应考虑问卷题项本身的内容与描 述,自行审慎判断。 筛选完后的问卷应加以编号,以便将来核对数据之用;之后再给予各变量、各题项一个 不同代码,并依问卷内容,有顺序的键入计算机 窗臼版SPSS可以读取传统文书文件的数据(配合简短语法文件程序)、微软 office应用软 件中 Excel、Aces之文件、传统数据库文件等,研究者可依自己的习惯,挑选一种自 己最熟悉的应用软件,以快速、有效的方式将数据键入计算机当中。(研究者最好是选 用一种oice软件输入数据或直接在SPSs数据窗口编辑区键入数据) 项目分析 项目分析即在求出每一个题项的“临界比率”( critical ratio;简称CR值),其求法是将所 有受试者在预试量表的得分总和依高低排列,得分前25%至33%者为高分组,得分后25% 至33%者为低分组,求出高低二组受试者在每题得分平均数差异的显著性检验(多数数据 分析时,均以测验总分最高的27%及最低的27%,作为高低分组界限),如果题项的CR 值达显者水准(a<05或<01),即表示这个题项能鉴别不同受试者的反应程度,此为题 项是否删除首应考虑的,项目分析操作方法请参考第2章 因素分析 项目分析完后,为检验量表的结构有效度 (construct validity),应进行因素分析。所谓结 构效度系指态度量表能测量理论的概念或特质之程度。因素分析目的即在找出量表潜在 的结构,减少题项的数目,使之变为一组较少而彼此相关较大的变量,此种因素分析方 法,是一种“探索性的因素分析”( exploratory factor analysis) 在因素分析时,一项重要工作是要保留多少个共同因素,在探索性因素分析中,常用的 原则 根据 Kaiser(1960)的观点,保留特征值大于1的因素,但此方法,题项如果太多,可 能会抽出较多的共同因素。避免抽出过多的共同因素,研究者也可限定因素抽取的数 目,但此方面通常多用于“验证性因素分析”上面。 2.根据陡坡图( scree plot因素变异量递减情形来决定。在陡坡图中,如果因素变异量图 形呈现由斜坡转为平坦,平坦状态以后的共同因素可以去掉。 在统计分析中,因素层面是否加以限制,或由电脑自行抽取,研究者均要自行考虑,如