在定义和衡量企业绩效的指标绩效时,为什么要考虑文化差异

当前位置: >>
第五章 心理差异测量理论与心理测验(2)
第一节 人事心理学研究的特点 ........................................................................................................... 5 第二节 数据统计方法........................................................
................................................................... 15X=?XN(公式 3-1) ................................................................................................................ 17SD ??(X ? X )2 N ?1(公式 3-2) ................................................................................................ 18Z?X?X?(公式 3-3) ................................................................................................................... 18r? xy? xyNS x S y(公式 3-4) ................................................................................................................... 202 2 2 S x ? S y ? S x? y? xy ? r ?x ?? y 6? D r ? 1?xy 2 2 R2?2S x ? S y??ZxZy(公式 3-5) ............................................. 20NN ( N ? 1)2(公式 3-6) ..................................................................................................... 20rpb?( X p ? X q ) ? St pq(公式 3-7) ................................................................................................. 20rb?X p ? Xt St?p y(公式 3-8) .............................................................................................. 21R2 复相关 1?23=2 2 r12 ? r13 ? 2r12 .r13 .r23 2 1 ? r23(公式 3-9) ..................................................................................... 21r2 偏相关 12?3=(r12 ? r13 .r23 ) 22 2 (1 ? r13 )(1 ? r23 )(公式 3-10) ............................................................................................. 22? Y ? aY ? bY X (公式 3-11) ................................................................................................................. 22bY ? N? XY ? ? X .? Y N ? X ? (? X )2 2(公式 3-12) ........................................................................................... 22aY ? Y ? bY X (公式 3-13) ............................................................................................................. 22bY ? rY . SY SX(公式 3-14) ................................................................................................................... 22? Y ? a ? bY 1.2 X1 ? bY 2.1 X 2 (公式 3-15) .......................................................................................... 221 式中回归系数 bY 1.2 ? ( SY / S X 1 ) ? y1.2 ; bY 2.1 ? ( SY / S X 2 ) ?Y 2.1 。(公式 3-16) ............................. 22r 其中, ?Y 1.2 ? ( rY 1 ? rY .2 .r1.2 ) /(1 ? r1.2 ) ; ?Y 2.1 ? ( Y .2 ? rY .1 .r1.2 ) /(1 ? r1.2 ) (公式 3-17) ....... 22 .2 2Z=D?0 (公式 3-18) ...................................................................................................................... 25 SEDXX1 ? X 2 (公式 3-19) ............................................................................................................. 25 SEDX2 S12 S 2 ? n1 n 2Z?SE DX ?(公式 3-20) ......................................................................................................... 25 (相关样本 n1=n2) (公式 3-21) ......................................................... 26SEDX ?2 S12 S 2 S S ? ? 2r 1 2 n n nSS 2 MS ? (公式 3-22) ................................................................................................................... 26 dfMS组间 ?2 SS组间 90 ? ? 90 (公式 3-23) ................................................................................... 27 df组间 2 ? 12 2 2 SS组内 ? SS A ? SS B ? 33.2 ? 29.2 ? 62.40 (公式 3-24) ....................................................................... 272 SS组内 62 .40 ? ? ? 7.80 (公式 3-25) ........................................................................... 27 df组内 2?5 ? 1?MS组内F?MS 组间 MS 组内?90 ? 11.54 (公式 3-26) ............................................................................................ 27 7.80?2?X ? ? ?2 =Z =2?2(公式 3-27) ................................................................................................... 28? 2 =∑Z2=∑ ? =?2?X ? ? ?2?2(公式 3-28) ........................................................................................... 28? f0 ? fe ?2fe(公式 3-29)..................................................................................................... 28?2=?Z 2? 2 d2? f0 ? fe ?2fe(公式 3-30)..................................................................................................... 28N=(公式 3-31)...................................................................................................................... 292 第三节多变量分析......................................................................................................................... 29? Y ? a ? b1 x1 ? b2 x2 ?b3 x3 ? ? ? bk xk1 (公式 3-32) .......................................................... 30第四节 心理测量理论........................................................................................................................... 34Z?X?X?(公式 3-33) ................................................................................................................. 36X==T+E (公式 3-34) ..................................................................................................................... 41 这里 X 为实得分数或观测分数,T 是假设的真分数,E 是测量误差。 ......................................... 41 因为T ?T=X-E(公式 3―35)............................................................. 41? ( X ? E)N则(公式 3-36) .......................................................... 41则T ??X ? XN(公式 3-37) ..................................................................... 42S2x=S2T+E (公式 3-38) ................................................................................ 42 即实得分数的变异数=真分数的变异数加上误差变异数 。 ........................................................... 42 S2X=S2T+E=S2T+S2E+2 STE =S2T+S2E+2γEXSTSE =S2T+S2E (公式 3-39) .............................................. 42 S2T= S2V + S2I (公式 3-40) 式中的 S2V 是与测量目的无关的 (亦即有效的)变异数,S2I 是与测量目的无关但却是稳定的变异数。S2V 是由所要测量的变因引 起的,S2I 是由其他变因引起的。........................................................................................................ 42 S2X=S2V+S2I+S2E (公式 3-41) .............................................................. 42r2 XX2 ST ? 2 SX(公式 3-42)................................................................................ 432 r XY ?2 SV 2 SX(公式 3-43)......................................................................................................... 43第五节 估计信度的方法..................................................................................................................... 44rXX ?rXX ?2rhh 1 ? rhhnrhh 1 ? (1 ? n)rhh(公式 3-44) ................................................................................................ 45 (公式 3-45) ................................................................................. 45rKK ? (K ? pi qi ) )(1 ? 2 K ?1 SX(公式 3-46)................................................................................. 46Y XX ? (2 Kpi qi KS X ? X ( K ? X ) K )(1 ? )? 2 2 K ?1 ( K ? 1) S X S X(公式 3-47) ..................................... 46W??N 1 .K 2 ( N 3 ? N ) 12Ri2 ?(?R )i2(公式 3-48) ............................................................................. 463 ?2=K(N-1) d?=N-1(公式 3-49).......................................................................... 47 (公式 3-50) .............................................................................. 48rnn ? 1 ??S2 o(1 ? roo )2 nrKK1 ? ( K ? 1) r XX? ? X 1 ? rXXmeansS KrXX(公式 3-51).............................................................................. 48?meas(公式 3-52) ................................................................................ 63means(X-1.96 ?)≤T≤(X+1.96 ?)(公式 3-53) ...................................................... 642 ? d ? ? 12 ? ? 2(公式 3-54) ...................................................................................... 65 (公式 3-55) ...................................................................................... 65? d ? S 2 ? rXX ? rYY第六节 心理测验的效度及研究方法 ................................................................................................... 494 第二章 心理统计与心理测量第一节 人事心理学研究的特点一、心理学研究遵循的原则 心理学是一门科学,它具有一切科学研究的特点。但是,许多人往往把心理学误 解为哲学或者玄学。这主要来源于两方面的原因∶一是心理学研究对象的特殊性,二 是对于心理学的科学研究方法缺乏了解和训练。实验心理学的建立使心理学摆脱了哲 学思辩的范畴,成为了一门独立的科学。由于实验心理学引入了自然科学的研究方法, 使心理学获得了搜集论据的新手段,从而使心理学的发展大大加快。从 1879 年实验心 理学诞生,至今不过百余年,心理学的发展却远远超过了以往的许多世纪。实验的方 法虽然不是心理学的唯一方法,但却是较有成效的方法之一。因此,充分认识心理学 研究方法的科学特点对于理解心理学和研究心理学都是非常重要的。 按照柯林格(Kerlinger)1973 年的《行为科学的研究基础》和格雷克与麦茨(Craig & Metze)1986 年的《心理学研究的方法》 ,可以把科学研究的特点概括为下述几个方面: 1、科学研究是客观的、实证的。科学家如果认为某一结论是正确的,那么他就必 须把他的结论付诸实验来进行检验。科学家在观察收集资料过程中,不应带有任何偏 见,必须如实地反映具体事实。任何个人的猜想、权威的建议、过去的研究结论都不 应影响科学家对事实的客观评价。科学家的认识、偏好、态度在没有经过事实的证实 之前都不能作为真理。 2、 科学研究所要探讨的是一般的原则。 科学研究是得到的是普通的、 一般的规律, 而不是某一特例。因此,现代科学研究往往以大量资料信息作为基础,科学家的结论 一般都具有相当高的统计意义上的肯定水平。 3、科学研究是系统的、控制的。科学研究不是简单地累积事实,而是把事实组织 成系统的解释体系。科学家往往对每一个可能影响结论的因素都妥善地控制,使研究 结论具有唯一的因果可能。 4、科学研究是自我纠正的。这一特点是科学研究与其他获得信息方法的主要不同 之处。科学研究方法在整个获得信息的过程中具有一种固有的检验机制,可以不断地 纠正科学家的结论和活动,即使研究证明了某一假设,科学家也要继续证明那些使所 得结论产生疑问的任何可能的假设。5 5、科学研究的结果是公开的。每一位科学家的研究报告都对研究的各个方面(研 究的目的、程度、变量的测定、获得的结果,得出的结论)进行描述,使这一研究领域 中的任何其他科学家都能够明了。 6、科学研究是可以重复的。正因为科学家遵守研究过程的系统控制原则并公开研 究结果,使另外的科学家能够在另一个时间、地点,来重复同样的研究过程并验证研 究的结果。心理学作为一门科学,心理学的研究也必须具备上述特点。与自然科学所 不同的是在心理学研究中,研究对象不是物而是人,不仅是人的外显行为还包括人的 内在的心理活动。内在的心理活动是无法直接观察和测量的,只能通过行为的观察和 测量来推断内在的心理活动,而心理活动又是有意识的、主观的,无论是主试还是被 试的心理和行为,都会受到其个人各种主观因素的影响;同时,实验中实验结果还会 受到主试、被试、实验情境及三方面因素的交互作用。因此,心理学研究中的一个重 要特点就是多变量。多变量带来的一个问题是,不容易区分自变量与因变量之间的关 系。我们无论建立哪一个因素为自变量都很难创造一个理想的条件,保持其它所有无 关变量恒定,以使该自变量与因变量的关系清晰地显现出来,无关变量的混淆往往导 致研究误入歧途。 因此,要达到研究的客观性、控制的严密性、研究的可重复性等条 件是十分困难的,甚至是不可能的,给提高研究的可靠性带来极大的困难。 多变量带来的另一个问题是,由于影响被试的许多因素之间本来是相互关联的, 因此,假如把一个多因素问题,如∶Y=f (a,b,c,??)简单地分解为多个单因素问 题来加以探讨,如,Y=f (a) ,Y=f (b), Y=f (c) ??这是不符和事实的,也是不科学 的。 由于心理学的研究相当的困难,曾有一位心理学家发出了这样的感叹“上帝很不 公平,把世界上简单的问题给了物理学,而把最困难的问题都留给了心理学” 。同时我 们也需要注意‘心理学的理论大都是理论假设,而不是理论实际’ 。二、心理学研究中的变量及误差 1、心理学研究中的变量 心理学是研究心理现象的科学。心理现象遵循∶刺激(外部或内部)?心理过程? 行为模式。心理学即研究刺激变量?心理过程?行为反应的过程,及这一过程中各个 变量之间的关系。在这一过程中刺激变量和行为反应变量是可观察可测量的,而心理 现象这一中介变量只能通过行为反应进行推论。因此心理学研究从两类变量入手进6 行∶ (1) 自变量∶即刺激变量。这类变量是本身独立变化的,在实验中有意加以改变, 借以寻找出由于它的变化将导致什么样的结果出现。例如,在感觉实验中刺激物的强 度,在人事心理学研究中往往是某种作用、效率产生的原因。 (2) 因变量∶即反应变量。它随着自变量的变化而变化,是实验中拟测的指标。 人事心理学中最常用的因变量是绩效和满意度两个指标,这两个指标也是人力资源管 理所追求的两个目标。 (3) 控制变量∶是研究设计中与所研究的问题无关,但又对研究结果产生影响的 变量。例如当我们希望研究几种不同培训方法哪一种更有效时,被试的态度、习惯、 动机、被试的准备状态等因素往往会影响到我们的实验结果,而这些因素又不是我们 所要研究的因素,于是,我们需要对这些因素进行控制,我们把这类变量称之为控制 变量。对于控制变量对研究结果的影响是心理学研究方法努力加以解决的问题,实验 心理学和心理统计学分别从实验条件设计和统计两个方面对控制变量的影响加以控制 和剔除。 2、心理学研究中的误差 心理学研究中的误差按其性质可分为三类,随机误差、系统误差(又称恒定误差)、 过时误差。 (1) 随机误差∶又称偶然误差。是由于实验中的一些偶然因素引起'而又不容易控 制的误差。它包括实验者在观测实验时主观和客观上不可控制的因素造成的误差,也 包括被试的一些偶然的不可控制因素造成的误差,还包括主试、被试以及实验情境交 互作用造成的误差。随机误差产生的原因十分复杂,但其存在是绝对的。随着实验观 测次数的增加,随机误差的变化会呈现一定的规律性,即它总是围绕被观测的真正值 (又称真分数,一般用多次观测的平均值来表示,由于观察条件、仪器等的限制,严格 地说来,真正值是无法测量到的)波动,随机误差的算术平均数随着观测次数的增加而 逐渐减少以至于趋近于零。 (2) 系统误差∶就是观测过程中服从确定规律性的误差。由于实验条件不同,造 成不同的有一定规律性的误差属于这类误差。心理学实验中,不同的实验方法、不同 的被试样本等都会对实验结果产生规律性的影响。这类误差不能通过增加实验次数消 除。如果需要可以通过实验设计加以消除,这一问题我们将在后边的变量处理和实验 设计中讨论。7 (3) 过失误差∶一般把明显歪曲实验结果的误差成为过失误差,它是由于实验观 测过程中的过失造成的。这些错误有测错、传错、记错、仪器失灵、取样错误。在实 验数据整理过程中必须鉴别、舍弃这些含有过失误差的数据(又称异常点),否则会严 重影响实验结果的准确性,得出不正确的结论。 在一组实验数据中,随机误差、系统误差、过失误差总是错综复杂地存在着,因 而造成了观测数据的波动性或变异性。 3、心理学研究中的变量处理 朗克尔、麦克格雷期*(Runkel,McGrath,1972)总结了心理学研究中的各种变量 及处理方法,见表 3-1。表 3-1 研究变量的处理假如我们研究新旧两种报酬 方案对员工绩效的影响。 报酬方案 是自变量,员工绩效则为因变量。 但是还应看到, 并不是只有报酬方 法这一个变量能引起因变量―― 工作绩效的改变, 还有很多其他自 变量,如员工的能力、管理制度、 劳动环境及劳动设备等变量, 都能1 ?不测量 a.忽略(处理 1) b.随机(处理 2) 2 ?在下列条件下测量 a.不控制(处理 3) b.通过下列方式控制 ①控制恒定(处理 4) ②匹配(处理 5) ③控制于特定的水平或特定的状态上(处理 6)引起因变量绩效的改变。当我们想要研究报酬方案对绩效的影响时,就要使之成为唯 一影响绩效的因素。为了达到研究目的,在实验中怎样控制其他变量,从而探讨自变 量(报酬方案)对因变量(绩效)单独的影响规律呢?此外,我们对自变量和因变量又采取 什么处理方法来研究它们之间的关系呢? 对变量的第一种处理是忽略。即对那些不会引起自变量水平发生变化的变量,我 们可以忽略不计。例如,由于在室内工作,室外的阴晴引起的光照变化就可以忽略不 计。 第二种处理是随机。即对那些确实能引起自变量水平发生变化的变量,随机化是 一种处理办法。 例如, 两组员工劳动的厂房和机器等影响变量, 就可以采用随机化( 抽 “ 签”)的办法来确定哪一组在哪一个厂房,使用哪些机器进行工作。通过随机处理,变 量的影响仅仅由概率所决定,因此,这一变量对因变量的影响就可以不予考虑了。 第三种处理就是不加任何控制地测量。这是对所要研究的因变量的处理办法。如, 工作绩效。8 第四种处理为保持一致。如在这项研究中,即可对两组采用相同的管理措施,控 制其为恒定。虽然这一变量依旧会对工作绩效产生影响,但由于在两组中都具有同样 的影响效果,所以,不会造成因变量差异。 第五种处理为匹配。即对于那些无法控制为恒定的变量,可以采用匹配的办法来 消除其对因变量产生的影响。如,员工能力的差异,在两组中员工的工作能力不可能 控制不变,但是可以把两组员工按能力水平进行匹配,即每一组都有同样数量的优秀 员工、中等员工和差的员工,这样,这个变量的影响就得到了控制。 最后一种处理为控制于特定水平或特定状态上。即对于研究的自变量,我们往往 就采取这种处理方法,控制其于特定水平或特定状态来检验其对因变量的作用。在我 们的研究中,自变量被控制于新的报酬方法和旧的报酬方法两种状态上。 我们经过对各个变量进行上述过程的处理,最终就可以得到报酬方法对工作效率 的影响关系的结果,通过统计分析,就可以做出研究结论。因此,心理学实验研究方 法的宗旨就是通过对自变量、因变量的测量处理,对其他有关变量的控制处理,来得 到自变量与因变量关系的研究结论。实验法的研究过程确保了研究的科学性。 后面实验设计中我们将讨论控制各种变量的研究设计方法。三、人事心理学的研究类型 人事心理学研究的内容很广泛,按其研究课题的性质和特点的不同,可以选用不 同类型的研究设计。常用的研究类型包括:发展研究 、个案研究、 相关研究、 实验 和准实验研究。 1、发展研究 发展研究,是从事件发展的过程研究事件变化和影响事件发展的各种因素及其相 互关系。它既描述了一定情境中各种因素之间的相互关系,也试图说明这种关系随时 间发展所发生的变化。发展研究主要有三种类型: (1)、纵向研究:这是指在一段时间内,对相同的对象样本进行观察和研究,即从 时间和发展过程来考察研究对象。例如,为了考察青年工人劳动技能的变化,选取一 批青工为对象,在半年时间内,每个月进行一次有关技能水平的观察和测定,并通过 综合分析,找出劳动技能发展的特点和主要因素,为制定技术培训方案提供依据。 (2)、横切法研究:这是在较短的时间内,对不同的对象样本进行观察和测定,从 而对各类人员做出总体性分析和考察。这种研究类型在人事心理学研究中采用得比较9 多。例如,劳动人事部门需要建立有关本单位干部、职工的心理特点的档案,可以通 过心理测评了解同类型的干部和职工的工作能力、技术、需要、态度、个性和工作实 绩,进而取得有关各类人员心理特征的总体资料。 (3)、预测研究:这是有关对象的过去情况的数据与资料的基础上,建立某种预测 模型;收集新的数据进行检验,付诸实际应用。这种研究型的人事预测和人力资源计 划方面用途很广泛。例如,根据企业现有职工的技术能力和工作实绩之间的关系,建 立有关工作成效的预测模型,在以后的人员录用工作中,根据求职者测评结果所反映 出的技能特点,预测他们一旦被录用后可能取得的工作成绩,并以此决定是否录用这 些人。 2、个案研究和抽样调查 个案研究集中于对少量对象的整体情况做出比较全面、 深入和详尽的考察和研究, 并重视个案对于所属总体的普遍意义。个案研究的应用较为普遍。例如,新型劳动组 合方式和奖励制度的尝试,工作环境的设计,工作负荷的分析,培训方案的评价,等 等,都可以采用个案研究的办法。个案研究要求研究者具有较高的综合和分析资料的 能力,并特别注意研究样本的代表性,以便提高个案研究结果的可应用性。 抽样调查是在自然条件下,以标准化的方式,运用问卷、访问或观察方法直接采 集数据资料的一种研究。这种研究简便易行,效率也比较高。但应采用比较严格的取 样方法,保证样本的代表性。 3、相关研究 人的工作表现和作为是由多种心理因素、工作情境因素和社会因素共同作用所决 定的。因此,了解这些因素之间的相互关系,对于搞好劳动人事管理尤为重要。相关 研究就是根据与对象有关的各种因素之间的相互关系, 就对象的特征和行为做出解释、 预测和控制的研究类型。最常用的是皮尔逊(Pearson,K.)的积矩相关系数。在运用时, 应特别注意数据是否满足相关分析的一些基本假设。相关研究的应用十分普遍。例如, 分析企业职工的文化程度与生产效率之间的关系,考察不同奖励方式与工作积极性之 间的关系,在人事决策工作中,常常把待业人员的心理能力倾向的测定与工作成效之 间的相关程度作为预测指标。需要指出的是,相关只表示了因素之间存在某种联系, 这种联系并不一定是因果关系。相关研究比较简便,也不需要很大的样本。但是,由 于相关研究对所研究的变量缺乏控制,因而对结果的解释需要特别谨慎。 4、实验和准实验研究10 恩格斯曾经强调了实验和活动对于证明因果关系的重要性, 他指出, “单凭观察所 得的经验,是决不能充分证明必然性的。??必然性的证明是在人类活动中,在实验 中,在劳动中。 ”在人事心理学研究中,可以运用实验方法,周密地控制和操纵决定事 件或行为的条件和变量,观察与测定行为及心理活动的各种变化。实验的基本条件之 一是研究对象和实验程序的随机化,要使各组条件尽可能均等。 在实际应用时,往往不可能对正常工作中的小组或人员随机分组,因此需要采用 准实验设计,直接以原小组作为实验组和对照组。准实验的特点是不采取随机化方法 选择被试。四、人事心理学的研究方法 人事心理学研究的内容很广泛, 按搜集数据的方法不同可分为: 实验法、 观察法、 调查法和心理测验。 1.实验法 实验法是指在室实验中通过严格控制实验条件,以获得自变量与因变量关系的测 量值,并通过统计方法对数据结果进行分析,然后做出结论的方法。实验的基本条件 之一是研究对象和实验程序的随机化,要使各组条件尽可能均等。 实验室研究的优点就在于能够很好地处理、控制多种变量,实验室研究是心理学 研究中控制变量最严格的方法,其结果可以进行因果解释。但是,实验室的实验研究 也存在着问题。由于实验室是非自然情况境,人工的环境可能就是一个对因变量的影 响因素。因此,心理学实验在可能的情况下最好在现场进行,这就是所谓的现场实验 方法(又称准实验法)。在现场实验中,也要对有关变量进行控制。 2.观察法 观察法是在一定情况下对行为或行为结果的观察和记录。观察法又分自然观察法 和控制观察法(又称为参与观察)。 自然观察法。一般来说,最理想的状态是能够对研究中的各个变量全面地、严格 地控制。但是在有些情况下,任何控制都会对研究结果产生影响;另外,有些研究问 题又属于无法控制的。例如,工作中的冲突。冲突的发生本是无法控制的,冲突过程 的任何控制也都影响研究结果。有些情况下,研究的性质也不需要研究者十分精确地 控制变量。因此,在上述这些情况下,心理学家可以采用在自然状态下,对变量不加 任何控制的现场自然观察研究方法。自然观察法的优点是,被观察的行为和情景能够11 完全代表实际工作中出现的现象, 因此, 取得的结果更容易运用于实际生活中。 但是, 由于不能控制变量,使得自然观察法往往难于得到有把握的结论;另外,研究的结果 也无法重复。 采用自然观察研究方法往往是一些相关研究。一般对相关研究结果的解释都很谨 慎,因为相关研究中变量往往缺乏控制,相关研究的结果是表示因素之间存在着某种 联系。变量之间准确关系的结论则需要有控制的实验研究才能得到。 人事心理学研究中,主要是对工作行为及其结果的观察。研究者为了能够更多更 详细了解工作信息, 常常需要一种参与观察, 即被观察者按照观察者的要求进行操作, 以便观察者能够详细、准确地记录工作信息。 观察法可以按事先计划的程度分为有结构观察和无结构观察。大多数观察研究都 事先设计好要观察什么,如何观察,如何记录,这就是所谓的结构性观察。有些自然 观察的研究,由于事先对研究的结果无法进行预测,因此,只能进行无结构性观察。 观察方法的优点是得到结果的方式直接、客观,因此,所得到的结论就更为客观,比 较容易运用到实际工作中去。 观察中有一个行为取样问题。人事心理学研究主要运用两种观察取样。(1)事件取 样观察法∶即观察工作活动的整体,研究者只观察和记录事先根据研究目的所确定的 某些行为和活动。(2)时间取样观察法∶在一定的时间内分段观察和记录。一般在工作 开始、中期和结束时分段观察,也可以随机选择观察时间。 3.调查法 从科学研究的客观性角度来看,研究资料最好应采用客观观察来得到。然而,心 理学的研究对象是人的内部心理活动,是难以观察的。虽然心理学家尽可能通过对外 部行为的观察来进行研究,但是,很多时候对于内部心理活动的研究还需要通过研究 被试的主观陈述即用调查法进行。但这并不意味着调查法的研究不具有客观性,心理 学家要通过一系列控制手段来保证研究的客观性。调查法分为问卷法和会谈法。 问卷法是采用书面问卷形式获得研究资料的方法。为了使通过问卷得到的研究结 果更为客观准确,通常采用标准化的问卷来进行。问卷法简便易行,有利于进行统计 分析,有利于收集大量资料。但是,问卷法不易获得问卷以外的资料与信息,也不适 用于文化程度较低或文字理解能力较低的被试。问卷调查有别于心理测验,心理测验 是标准化的问卷。 会谈是通过会谈主持者与被访者的谈话形式来获得研究资料的方法。会谈根据提12 问的方法或回答方式可分为四种类型,见下表 3-2: 结构性会谈是事先对所要提的问题及回答范围的选择和评定都作了设计规定,实 际就是问卷的口头实施。无结构性会谈是事先不对所要提的问题及回答方式作任何规 定,但是也不是漫无边际地“闲聊” 。它往往需要会谈主持者以技巧来引导被访者做 出回答,并根据回答再作引导,直到主持者得到所需要的研究资料。无结构性会谈要 求会谈主持人具有相当高的技术水平,这种方法往往应用于临床心理学的研究和实践 中。半结构性会谈,则介乎于这两种会谈之间。回 访 谈 问 答?方会谈法比问卷法更为灵活,更无结构 式 无结构访谈 半结构访谈有结构题能够发现那些影响研究结果的被研半结构访谈 有结构访谈无结构 有结构 表 3-2究者的主观因素, 并加以引导控制。 但是,会谈法比较费时,从某种意 义上说,会谈相对于问卷又多了主会谈的类型持人对被访者的影响这一因素。 因此, 结果的准确程度就会比问卷法低。 无论是问卷, 还是会谈,研究结果都受被研究对象的主观心理因素影响,所得到的结果都不如观察 法那样直接、客观。当然,问卷与会谈研究结果的客观准确程度都可以通过标准化的 结构设计和控制各种影响因素来加以提高。 4.心理测验 心理测验基本上亦是一种资料搜集的工具,但却不同于一般所泛称的“测验” , 它是一种相当专门化的测量工具,有其特殊定义和要件。首先,心理测验的资料搜集 对象是个体或群体的心理行为和特质,由于它们欲测量的对象行为具有独特的性质, 心理测验必须以专门化的测量原理和方法加以设计,才能实现其功能,适当地衡量个 体间的差异情况。心理学者 Cronbach(1984)将心理测验界定为对行为样本(behavior sample) 以 系 统 化 的 步 骤 加 以 观 察 并 将 其 结 果 以 数 字 表 示 出 来 的 方 法 。 Annastasi(1988)在给心理测验下定义时认为它是一种可以对行为样本加以客观化和 标准化测量的尺度。其他的心理学者如 Graham and Lilly(1984)、Kerlinger(1979) 等在讨论心理测验的定义时,也大多持有近似的看法,他们都强调心理测验是一种行 为取样的程序和工具,通常具有客观化、系统化、数量化和标准化几个特征。 以行为取样作为搜集资料的方法是心理测验的基本观念。也就是说心理测验所搜 集的是行为样本而非全体。这是由于受到时间或空间的限制,我们无法亦无须对行为 之全体一一加以观察和衡量,是以尽可能作合理的抽样,并从样本上去对行为全体加13 以估测和了解,所以心理测验可被视为对行为取样所设计的工具。经由专门的设计, 测验的结果(样本)对行为全体具有相当的代表性。譬如说,人格测验的结果可以用来 代表个体在非测验情境中的人格运作,语言测验的结果可以代表个体的语言能力等 等。行为取样在心理测验学的观点来说是必须而且经济的。但重要的是,行为样本必 须能对行为全体具有代表性,其代表性的高低,直接关系到心理测验的价值。假如一 个心理测验的样本对所要测量的对象行为并不具代表性,那么该测验便没有价值可 言。行为样本的代表性可经由效度这个观念去加以检验。 在了解心理测验所搜集的是具有代表性的行为样本之后,还应同时注意前述的客 观性、系统化、数量化和标准化等几个特征。这些特征在心理测验的设计上各有其重 要性,会直接影响到测验的品质和用途。客观性和系统化是任何科学方法和程序所必 备的,心理测验也不例外。客观性意指在测验的过程中,尽量将人为的主观因素减至 最低,使测验的结果不受到任何主观因素的支配和影响。一个高度客观的心理测验, 可任由不同的测验者实施、评分和解释,皆可获致同样的结果。系统化强调在测量任 何心理建构的过程中,从行为之界定、刺激之确立、测验之编制,进而到其实施和运 用,皆应以条理而有组织的方法为之,务求其周全,以减低可能发生的随机误差。例 如在测验的编制上,可以以统计方法对刺激的难度和区分度做客观的评定,在测验实 施的步骤上作系统的安排等等。 数量化是指心理测验的结果应以数量表示出来,数量之决定可依某种测量尺度或 分类系统为之。数量化在心理测验上受到重视,乃是因为数字是客观而精确的,并且 测验的量化结果可以依数学原理转化成各种不同的分数,增加资料处理的方便。譬如 说, 我们可以将各种量化的数据加以比较, 藉以了解个体间差异或个体内差异的现象。 假如无法将测验结果以数字表示出来, 要研究这许多复杂的现象、 便会令人无处下手。 另外,标准化也是心理测验的一个重要特征。所谓标准化是指测验的实施和分应有统 一的规则和标准,不可由测验者任意加以变更。其目的是要对测验的整个过程加以适 当的控制,也就是说,所有受试者在测验上皆受到同等的对待,个体成为测验上唯一 的自变项。只有如此,我们才能将各受试的反应放在同一水平上以同一尺度去加以比 较。心理测验标准化的立论和实验设计上的控制自变项的原理是相同的。在实验设计 上,唯有对实验者所操纵自变项以外的其他变项加以严密的控制,才能确立实验的结 果, 否则依变项便会产生混淆而难以解释的结果。 同样地, 如果我们不对测验的刺激、 实施、评分和解释等加以适当的控制,便很难确定测验结果所显示的是个体间行为反14 应的真正差异,抑或测验上的人为误差。 由上可知,心理测验乃是为了对个体的行为加以适当取样和正确衡量而专门设计 的工具, 有其特殊的性质和要件。 然而我们在此也要指出, 对上述各要件的完全达成, 并不是容易的事。客观性和系统化是所有心理测验共同追求的基本目标,但在对这两 个要件的实践上,各测验之间往往产生颇大的差别。数量化和标准化的基本原则也是 众所公认的。但是对这两个特征的阐释和实践程度上,学者之间存有不同的看法。譬 如,精神分析学派学者主张以投射技术来衡量个体的人格运作,他们认为数量化虽是 有助益的但却非必须的,在一定程度上对个体反应的质的分析常能提供更有价值的资 料。另外,以标准化来说,有的测验可能仅注意到刺激和测验情境的标准化而不及其 他,但有的测验则不仅重视刺激和测验情境的标准化,更通过建立大规模的常模 (norms),对测验结果的评分和解释也加以标准化。因此,不同的心理测验在实现这 些条件上,是不尽一致的。重要的是,我们应对心理测验的基本定义和要素具有正确 的概念,以使对个体诸多行为的衡量和理解,建立在良好的基础上。第二节 数据统计方法统计是心理学研究的支柱。它们被用来理解观测到的结果,并被用来确定这些发 现是否正确。运用我们介绍的这些方法,心理学家能够整理出数据的频次分布,并计 算出这些分数的集中趋势和离散性。他们还可以用相关系数确定出几组分数间相互联 系的强度和方向。最后,心理学研究者能够确定出观测值对总体的代表程度以及它们 是否与总体有显著差异。例如,你的智商是 120,我们可以认为你有较高的智商,那 么较高的结论是如何得出的呢?那是因为用同样的智力测量方法测量了许多人(取 样) ,其平均智商是 100,因此说你比一般人高。心理学的研究结论就是数据统计分析 的基础上做出的,可以说是统计结论。所以,心理统计在心理学研究中是极为重要的 方法和手段,也是心理学研究中必不可少的程序。 心理学的统计方法主要分为描述方法和推论统计两大部分。一、一组数据特征的描述统计 描述统计是统计分析的第一步,是对研究数据进行初步整理,找出数据的分布特 征。它通过一些统计指标来描述所获得的研究资料的特征,这些指标包括对一组数据15 资料分布的集中趋势、离散程度、峰态值和偏态值;以及对于两组或两组以上的数据 之间的相关关系及回归趋势的描述。 1.数据的分布 假如一项研究对 100 个候选人进行了心理测验,测验的分数如表 3-3 所示: 表 3-3 100 人的测验分 图 3-1 分数散点图为了使这些数据具有一定规律, 研究者可以根据测验分数的大小, 列出分数散点 图(如图 3-1 所示) ,这叫做次数分布。由图 3-1 可以看到分布的最高次数在正中,分 布基本上是对称的,两端的次数都很少,这种分布可以近似为一种常态分布。理想的 常态分布曲线呈平滑的倒钟形,从理论上来说心理活动的趋势通常都是呈常态分布。 并不是所有的分布都是常态分布,分布可能是不对称的、偏态的。除了偏态分布 外,还可能出现双峰分布。心理统计中常出现的分布有:Z 分布(正态分布) 分布、 、t F 分布、χ2 分布。其典型图见图 3-2、3-3 和图 3-4:df=∞相 对 次 数 df=25 df=9df=1-4-3-2-1 0 +1 +2 +3 图 3-2 t 分布与正态分布图+416 df1==8,df2=4相 对 次 数df1==4,df2=8df1==6,df2=60 df=1 相 对 次 数 df= 2 df= 42.04. 0图 3-3F 分布df=6 df=100图 3-4χ2 分布1 0202.数据的特征描述 (1) 集中趋势 反映数据集中趋势主要有三种指标:中数、众数、平均数。中数在数据分布非偏 斜的情况下, 可以替代算术平均数作为集中趋势的指标。 众数最少受极端分数的影响, 计算较简单,适宜作估算。平均数是分数分布的平均点,是最常用指标,因为它适宜 统计运算。其计算公式为:X =?XN(公式 3-1)式中: X 为平均值;X 为测量值;N 为测量次数 (2) 离散程度 关于离散性的最简单的一类度量是全距,即频率分布中最高值与最低值之间的差 值。在计算全距时,我们只需要知道两个数值:最高值和最低值。其次是四分距数、 平均差(AD=∑|x|/N,其中 x ? X ? X ) 、标准差。统计中最常用的是标准差。17 全距易于计算,但心理学家常常更喜欢用那些更敏感的、将所有数据都考虑进来 而不是只考虑极端数值的度量。 一个普遍使用的度量是标准差(standard deviation, SD), 它代表着所有分数与其平均数之间的平均差值。要计算标准差,我们需要知道数据的 平均值和单个的具体分数。一般的步骤包括先用各个分数减去均值,然后再确定出这 些离均差的平均值。公式如下:SD ??(X ? X )2 N ?1(公式 3-2)( X ? X )这个表达式的意思是“分数减去平均值” ,通常称之为离均差。先从各个分 数中减去平均值,然后将得到的结果进行平方(以消除负值)。把这些数值相加(∑),然 后再除以观测值的数目(N),就得到了方差的均值。这个符号要求我们对包括在符号 内的数值取平方根以抵消前面的平方操作。 标准差可以告诉我们一组分数的离散程度。标准差越大,则数据分布越分散。当 标准差很小时, 分数距离平均值更紧密, 平均数是整个数据分布的―个很好的代表值, 而当标准差很大时,它对整组数据的代表性将减小。 (3) Z 分数 在正态分布中,平均数和标准差之间存在着特定的关系。在分布曲线中,不同标 准差范围所包含的面积成一定比例。通常在进行心理学研究中,都假定分布符合正态 分布,根据正态分布中的概率情况来研究数据的特点。 Z 分数,又称标准分数。在正态分布中,Z 分数是以平均数为参照点,以标准差 为单位的量表。即将原始分数,减去平均数,除以标准差,就把原始分数转换成了 Z 分数。Z? X?X?(公式 3-3)Z 分数在心理统计中十分重要,它与原始分数比较有许多优点。其中最主要的一 点是把原始分数的等级量表水平提高到了等距量表水平,因此,心理测验的分数常采 用标准分数。 (4) 偏态值(SK)与峰态度(Ku) 峰态度(Ku)是相对于正态分布曲线的起伏程度。峰态度按起伏程度不同分为正 峰态(尖峰态)和负峰态(低峰态) 。 偏峰态(SK)是相对于正态分布曲线的偏离程度。偏态度按偏斜程度不同又分为18 正偏态和负偏态。 图 3-5 显示了正偏态分布和负偏态分布中中数、众数、平均数三种集中趋势指标 在的关系。图 3-5三种集中趋势指标在(A) 对称分布(B) 正偏态分布(C) 负偏态分布中的关系二、两组或两组以上数据关系的描述――相关分析与回归 1.相关的概念 到目前为止,我们所讨论的统计分析都仅限于对一个变量的描述,但是在人事心 理学研究中, 经常讨论的是两个 变量之间的关系。 描述两个变量 之间关系的一种统计指标就是 相关系数。相关系数在+1.00 到 -1.00 之间,相关系数的正负表 明了相关方向, 其绝对值表明了 相关程度。 相关的方向可以是正的, 也 可以是负的。 正相关表明一个变 量增长,另一个变量也同样增19图 3-6 正相关、负相关、零相关 长,如图 3-6(A、B、C) 。在身高与体重之间的相关常常是正相关。负相关则是一个 变量在量上增加时,另一个变量则相应地减少,如图 3-6(C、D、E) ,比如,工作态 度和次品率之间的相关就是负相关。 最常用的计算直线相关的方法是皮尔逊(K.pearson)相关公式:rxy?? xyNS x S y(公式 3-4)式中: x ? ( X ? X ); y ? (Y ? Y ) ;N 为成对的变量数目;Sx 为变量 X 的标准差;Sy 为变量 Y 的标准差。上式也可写成:rxy?? xy ?x ?? y22?2 2 2 S x ? S y ? S x? y2S x ? S y??ZxZy(公式 3-5)N其他相关估计方法,可参阅有关心理统计学书籍。在此列出几种心理学研究中常 用相关的计算方法。 2.特殊相关 (1)等级相关 其又称斯皮尔曼(Spearman)等级相关,用 rR 表示。由于积差相关系数的计算要 求两相关变量为正态双变量,NQ30,而心理学研究中,搜集到的资料有时少于 30, 并且分布形态不明确,或搜集到的资料是按等级排列的,如品质优劣、爱好程度等。 对于这类两变量关系的研究,可使用等级相关的方法。与积差相关相比,等级相关的 优越性在于它不涉及变量的分布形态和 N 的多少,并且适用于等级评定的资料。其计 算公式如下:r(2)点二列相关R? 1?6? D 2 N ( N ? 1)2(公式 3-6)式中:D 为二列对偶等级的差数;N 为等级的数目。如果 X、 两变量之中, Y 有一个变量是二分名义变量, 即只分两种情况的变量 (如 生、死、巳、未婚、男、女等) ,而另一变量是等距的或比率的连续变量时,就要使 用点二列相关。有时如果有一个变量是双峰分配时,尽管它并不是真正的二分变量, 亦可使用这种统计方法,如文盲、非文盲。其计算公式如下:rpb?( X p ? X q ) ? St pq(公式 3-7)式中: 是与一个二分变量对偶的另一列连续变量的平均数; 是与另一个二分变量20 对偶的另一列连续变量的平均数; p 是一个二分变量的次数与总次数之比;q ? 1 ? p ; St 是那一列连续变量的标准差。 (3)二列相关 它适用于 X 变量、Y 变量均为常态的连续变量。但是,其中的一个变量因为某些 理由被人为地分为两个类别,即两个变量中一个变量是等距变量,另一个是常态的二 分名义变量。例如,学习成绩与身体的关系:学习成绩、健康状态都是常态分配,但 用人为的方法分为好、差两种。二列相关中的两个变量符合皮尔逊积差相关系数的假 设时(正态双变量) ,求得的二列相关系数可以作为皮尔逊积差相关系数的估计值。 其计算公式如下:rb?X p ? Xt St?p y(公式 3-8)式中: 为一分变量 X 的平均数;为所有 X 的平均数;St 是所有 X 的标准差;p是被问及是否连续变量有关的那一个变项次数的百分比;y 是 p 的常态曲线下的纵线 高度。 当研究的变量不仅仅是两个而是多个变量时,仍可以讨论其相关程度,这就是所 谓多重相关的问题,多重相关又分为复相关和偏相关。 3.复相关与偏相关 (1)复相关 复相关是指一个变量与多个变量之间的相关。例如,在人事心理学研究中,我们 经常要考虑多种影响工作绩效的因素,员工的能力、工作态度、工作兴趣、工作经历 等,因此,在预测工作绩效时就需要考虑多方面的影响因素,寻求多个因素与工作绩 效之间的关系,这就构成复相关。计算一个变量(因变量)与另两个变量(自变量) 之间的复相关公式如下: R2 复相关 1?23= (2)偏相关 两个变量之间的偏相关是指在消除两个变量与第三个变量(或几个其他变量)的 相关效果后取得的相关效果。如,一组年龄变化不定的男孩在身高和体重之间的相关 要比一组年龄固定的男孩在身高和体重之间的相关高一些。2 2 r12 ? r13 ? 2r12 .r13 .r23 2 1 ? r23(公式 3-9)21 r2 偏相关 12?3=(r12 ? r13 .r23 ) 22 2 (1 ? r13 )(1 ? r23 )(公式 3-10)除了直线相关外,变量之间的相关还可能是曲线相关。对于曲线相关的变量,用 直线相关计算公式得到的相关估计有可能为零。但是,并不能说明变量之间不存在相 关。曲线相关需要用其他方法来估计。 4.回归分析 相关用来描述变量之间的现有关系,回归则是根据一些变量的特征来预测另一些 变量的状态。 一个因变量随着一些自变量的变化而变化,这个因变量与那些自变量之间的关系 可以用方程式来表示。这样,就可以通过方程从自变量的值来推算或估计与之相对应 的因变量的值。这个推算方程的求得称之为回归。直线回归方程是最简单的一种回归 方程。 二元直线回归分析,用回归方程表示从变量 X 推测变量 Y 变化的回归线为:? Y ? aY ? bY X(公式 3-11)式中:aY X 零值时的 Y 值或 Y 的截距;by 为回归系数。aY ,by 的计算公式为:bY ? N? XY ? ? X .? Y N ? X ? (? X )2 2(公式 3-12)aY ? Y ? bY X (公式 3-13)式中:X, Y 为原始分数;N 为样本数目。 回归系数与相关系数有某种关系,如公式所示:bY ? rY . SY SX(公式 3-14)对三个变量以上的多重回归,也可以得到一个回归方程。例如,对于因变量与两 个自变量回归问题,回归方程一般是:? Y ? a ? bY 1.2 X1 ? bY 2.1 X 2 (公式 3-15)式中回归系数 bY 1.2 ? ( SY / S X 1 ) ? y1.2 ; bY 2.1 ? ( SY / S X 2 ) ?Y 2.1 。(公式 3-16)r 其中, ?Y 1.2 ? ( rY 1 ? rY .2 .r1.2 ) /(1 ? r122 ) ; ?Y 2.1 ? ( Y .2 ? rY .1 .r1.2 ) /(1 ? r122 ) (公式 3-17) . . .对任意多个变量的回归都可以用这种形式进行推算。22 三、推论统计 在典型的心理实验中,研究者关心的至少是两组实验数据(即实验组与控制组) 的结果比较。简单的比较差异是不能说明任何问题的,心理学家必须知道差异究竟大 到什么程度才具有意义(即差异才不是偶然的) ,这就是心理统计中差异显著性考验 问题。 1.T 检验 (1)统计检验的基本思想 任何实验都是从提出问题和研究假设开始的。当研究假设涉及直接可观察的或有 限的现象时(如物理现象) ,研究假设可以被证实或证伪,不需要通过统计推理。然 而,当研究涉及不可直接观察的现象或不能观察所有的事例时(即当研究假设不能通 过直接观察或通过观察总体的所有成员而直接被估价时) ,多数假说是需要进行统计 检验的。 统计检验的宗旨是确定以事实支持的概率。由于研究假设是关于变量之间关系的 一般预测,能够加以检验的事例非常多,要为所有事例一一取得支持是不可能的。例 如,一个研究假设提出,抽象思维的管理者比一个形象思维的管理者管理效果更好。 在接受这个假设之前,需要对所有的管理者在各种管理者在各种管理情境下的各种管 理指标进行检验,然而我们只可能在有限的事实上做出结论。 (2)统计检验的假说建立 由于为假说取得肯定的支持的难度很大,在实验研究中,研究者常常不直接对研 究假设加以证实,而是采取检验它的虚无形式,即检验虚无假说。虚无假说是研究假 说的否定式。例如,关于两个变量之间关系的预测有三种形式: 备择假说一:抽象思维的管理者比一个形象思维的管理者管理效果更好( ∶ ?1 &?2) ; 备择假说二: 抽象思维的管理者比一个形象思维的管理者管理效果更差 ∶?1&?2) ( ; 备择假说三:抽象思维的管理者与一个形象思维的管理者管理效果无差别( ∶ ?1=?2) 。 它们的统计假说的形式是∶ H0∶?1=?2 H1∶?1??2 虚无假说(H0)的基本思想是?1 与?2 的较小差别是由随机误差引起的,因而不23 是真正差别。如果?1 与?2 的差别较大,并且这种差别的出现大于一定的概率时,我 们可以通过推翻虚无假说,而间接接受备择假说。 在一个实验研究中,研究假说可能是备择假说一或备择假说二,然而为了统计检 验的目的,研究假说需转化为统计假说,统计检验的是虚无假说。即∶ 虚无假说 H0∶?1=?2。 (3)统计检验的显著性水平 我们说统计检验的宗旨是确定以事实支持的概率。在虚无假说中假定?1 与?2 的 较小差别是由随机误差引起的,因而不是真正差别。如果?1 与?2 的差别较大,并且 这种差别的出现大于一定的概率时,我们可以通过推翻虚无假说,而间接接受备择假 说。那么,?1 与?2 的差别在什么情况下才算大,什么情况下才算小哪?大小的界限 靠什么标准来确定?这就是显著性水平的问题。当由随机因素导致的概率小于 5%(以 p&0.05 来表示)时,心理学家将接受这个差异为“真” 。显著差异(significant difference) 是指符合这一标准的差异。不过,在某些情况下可能还会使用更严格的概率标准如 P&0.01(100 中不足 1 个)和 p&0.00l(1000 中不足 1 个)。 例如,我们仍然用上面的例子,研究&抽象思维的管理者是否比一个形象思维的 管理者管理效果更好&。如果按照虚无假说,二者无差别,H0∶?1=?2。那么,D=?1- ?2=0。而实际上,我们在随机地从两个样本中抽取若干样本并比较它们各对平均数之 间差异(D1,D2,D3,??)时,就会发现这些差异有些是正值,有些是负值,并不 完全等于零。如果我们测量的次数无限增多,它们差异的分布将出现以平均值为 0 的 正态分布。见图 3-7∶ 这个分布的标准差统计上称为 平均数差异的标准误,用 SE D 表X示。将某一次实得的差异 D 减去样 本平均数差异分配的平均数,除以-3σ -2σ -1σ 0 1σ 2σ 3σ标准误,即得出这次测量差异在虚 无假说分布中的 Z 分数∶图 3-7两个样本平均数差异 D 的分布24 Z?D?0 SE D X  (公式 3-18)通常在心理统计中,Z 值若落在正态分布的 95%(1-α )的范围内,我们接受虚 无假说(H0) ,若落在 95%以外,我们则拒绝接受虚无假说(H0) 。因为 Z 值落在 95% 以外,测量差异源于虚无假说的概率只有 5%,而此时我们拒绝虚无假说,接受不同思 维类型的管理者管理效果的确有差别的结论,这一结论错误的可能性只有 5%。因此, P.0。05, (即拒绝 H0 假设发生错误的可能性不超过 5%)就是心理统计中的一个置信界 限, 又称 P.0。05 显著性水平。 心理统计中更严格的显著性水平为 P.0。01,即在 P.0。01 水平 上拒绝 H0 假设发生错误的可能性不超过 1%。从正态分布表中我们可以查到,P.0。05 对 应的 Z 值为±1.96,P0。01 对应的 Z 值为±2.58。 综上所述,Z 考验的步骤可以归纳如下∶ 第一步:建立无差假说∶H0=?1-?2=0 第二步:计算 Z 值∶Z? D?0 SE D X  X1 ? X 2 SE D X其中, D ? X 1 ? X 2Z?(公式 3-19)需要注意的是,SE D 是平均数差异理论分布的标准差, 我们无法通过无数次测量 X 得到它。但在心理统计中我们可以用样本分布的标准差来估计 SE D , SE D 的估计值 X X 为∶SED X ?2 S12 S 2 ? n1 n 2(公式 3-20)式中 S1,S2 分别为两个样本的标准差,n1,n2 分别为两个样本的大小。 第三步: 比较 Z 与 P.05 时的 Z.05 值的大小。①若 Z≥Z.0。05 则拒绝 H0 假设;②若 Z <Z.05 则接受 H0 假设。 第四步:若 0.05 水平显著,则进一步检查在.0.01 水平上是否显著。 以上是两个独立的大样本的之一显著性水平考验。如果是相关的大样本,则 SE D 为:X25 SEDX ?2 S12 S 2 SS ? ? 2r 1 2 n n n(其中,相关样本 n1=n2=n) (公式 3-21)如果样本为小样本(n?30)则用 t 考验。t 考验的步骤与 Z 考验基本相同,只是 t.05 与 t.01 的值需要查 d?= n1 +n2-2 的 t 分布表。 (具体方法请参阅心理统计书籍) 2.F 检验与方差分析 F 检验对实验设计和统计分析的发展产生了重大的贡献,心理学实验设计就是以 F 检验为基础的。 F 检验的基本思想实际上是把“平均数之间是否存在差异”的检验转化为“变异 是否存在”的检验。F 检验思想就好象把组间变异放在一个“噪音”――误差变异的 背景上,只有当组间变异足够大,明显大于误差变异时,才说明处理效应存在。如果 组间变异与组内变异差不多,则说明处理效应不存在,只不过是一种“噪音”或随机 误差。 在方差分析中最长常用的两个概念是均方(MS)与平方和(SS2) 。计算均方的 公式是:MS ? SS 2 (公式 3-22) df下面我们用一个比较两种培训方法培训效果的研究加以说明。研究中将随机选取 的 10 名被试随机地分为 A,B 两组。在接受培训之前,两组被试的工作成绩为 XA, XB,两组被试在接受了不同培训方案的培训以后,工作成绩分别为 XA′, XB′。结果如 表 3-4:表 3-4 被试组 A 1 2 3 4 5 平均值 方差 培训前后工作成绩比较 实验前成绩 XA 4 8 9 11 12 X A =8.8 SA2=9.7 方法 1 培训后 成绩 XA′ 6 7 10 11 13 X A' =9.4S A' 2 =8.3被试组 B 1 2 3 4 5 平均值 方差实验前成绩 XB 5 7 9 10 12 X B =8.62 S B =7.3方法 2 培训后 成绩 XB′ 12b 14 15 17 19 X B ' =15.42 S B ' =7.3从表 3-4 的数据中,可以区分出来自两个方向的变异:在一个方向上,接受不同 培训的方法的 A,B 两组被试的分数,围绕着两组被试的平均数变化,如表 3-5 所示。表 3-5 两组被试分数围绕总平均数的变化26 实验处理 培训方法 1 培训方法 2X 47 77X =622 x?X ?X) x-15 +15225 225? x 2 =450接受不同处理的被试的分数,围绕平均数的变化在方差分析中是很重要的,它反 映了实验处理带来的变异,即组间变异。组间变异的平方和计算如下:2 SS组间 ?450 ? 90 5组间均方是:MS组间 ?2 SS组间 90 ? ? 90 (公式 3-23) df组间 2 ? 1在另一个方向上,每个被试的分数围绕各组的平均分数变化,如表 3-6。表 3-6 被试的分数围绕各组的平均分数变化 被试 1 2 3 4 5XA'XA'x A' ? ( X A' ? X A ' )x A'2被试 1 2 3 4 5X B'x B' ? ( X B' ? X B' )x B'26 7 10 11 13 =9.4-3.4 -2.4 +0.6 +1.6 +3.6?x11.56 5.76 0.36 2.56 12.962 A'12 14 15 17 19-3.4 -1.4 -0.4 +1.6 +3.6? 33.20X B ' ? 15.4?x11.56 1.96 0.16 2.56 12.962 B'? 29.20每个组内被试分数围绕平均数的变化,反映了接受同一处理的一组被试的变异, 这个变异是由随机误差造成的。将各处理组内变异相加,即是整个实验的实验误差。 这种变异在方差分析中也很重要,叫组内变异。组内变异的平方和计算如下:2 2 2 SS组内 ? SS A ? SS B ? 33.2 ? 29.2 ? 62.40(公式 3-24)组内均方的计算如下:MS组内2 SS组内 62 .40 ? ? ? 7.80 (公式 3-25) df组内 2?5 ? 1?这样可以区分出一组数据中的两个变异源:一个反映实验处理的效应,叫组间变 异;另一个反映接受同样处理的被试间的变异,叫组内变异或误差变异。F 检验是计 算组间变异与组内变异的比率。即:F? MS 组间 MS 组内 ? 90 ? 11.54 7.80(公式 3-26)查 F 分布表,在 0.05 水平上 F0.05=5.32,在 0.01 水平上 F0.01=11.26。 因为 F& F0。05q,且 F1& F0。0 所以处理效果在 0.05 水平上显著,在 0.01 水平上亦显27 著。 3. ? 检验,2? 2 (chi square)是一个多功能统计量,可以用来处理次数形式的数据,或易于转换为次数的数据。这种数据包括比例和概率。 ? 2 的一个重要特征是它的可加性, 它能使同一检验中几个统计量或其他的数值组合起来,所以那种含有多组数据的假设 可用 ? 2 检验其显著性。? 2 的基本性质能在 z 标准分的基础上予以解释。当只有一个自由度时, ? 2 ’与Z2 是等同的,或? 2 =Z2=?X ? ? ?2?2(公式 3-27)在这里 X 是正态分布总体中任何测量。μ是其平均数,σ是其标准差。假设我们 现在有个样本,其中有 X 的 k 个互不关联的测量。于是,也有 k 个互不关联的 z 值和 k 个互不关联的 ? 2 值。k 个互不关联的 ? 2 值的总和也是一个 ? 2 。这就是 ? 2 的最有用 的性质。其公式为:? 2 =∑Z2=∑?X ? ? ?2?2(公式 3-28)如果数据为次数,则计算公式为:?2=? ?2=?? f0 ? fe ?2fe(公式 3-29)? f0 ? fe ?2fe(公式 3-30)其中,fe 为是期待的次数,f0 为实得的次数。 假设我们抽选了 40 名员工,征求他们关于工资改革方案的意见。在这 40 人中, 28 人觉得改革的工资方案好,但有 12 人认为不好。这些次数是否来自一个赞同和反 对一样一半的总体?关于这个检验的虚无假设是 50%对 50%意见平分。在这个假设之 下,40 人的样本中,期待的次数是 Np=40? 0.5=20。所以,我们假定次数的总体分 布有一个 20 的平均数和一个 Npq 的方差,在这里, p=q=0.5。在 ? 2 的运算中,平28 均数是期待的次数 fe。拿它和一个实得的次数 f0 来比较。28 的实得次数是否与在虚无 假设基础上所期待的 20 次数有显著的区别? 4.需要的样本容量 研究人员在调查开始时,自然地提出一个问题, “我需要一个多大的样本?”对这 个问题,统计的思维能使我们得到圆满的答案。 假如我们进行劳动法改革的群众意见征询调查,如果我们通过随机抽取的样本能 很好地代表表决的总体。虚无假设暗指赞同和反对的平均比例各占 0.50。我们首先问 需要多大的样本才能使我们相信实得的 0.55 的赞同结果表示大多数群众支持改革, 而不仅是某一总体中由机遇而产生的结果,我们可以通过公式(2-?)计算: N= 在这里,Z 2? 2 d2(公式 3-31)z=相当于的正态曲线离差 σ=总体的标准差 d=特定的离差第三节 多变量分析多变量分析处理的是三个或三个以上变量间的关系,例如:从语文测验分数和数 学测验分数的线性组合来预测大学第一年学习成绩。多变量分析在测验领域中使用非 常普遍,我们有必要对不同方法用在什么地方有个一般性的了解。本部分会让大家熟 悉多变量分析中用到的一些术语,帮助大家了解在什么情况下使用什么方法。一、多变量分析的一般方法 多变量分析对行为研究很有用,因为它使我们可以考察多个变量之间的关系。前 面所讲的相关技术只涉及两个变量之间的关系,例如用它们处理紧张和疾病之间的关 系。但为了分了解疾病的起因,我们需要考虑除了紧张以外的许多潜在因素,多变量 分析就可以使我们研究多个预测源与一个结果的关系,此外,该方法允许我们对预测 源之间的关系作研究。 各种多变量分析方法的区别在于,使用的预测变量的数目和种相不同。它们的相 同之处在于,都是将几组变量转化为线性组合。线性组合就是对最初变量的一种加权29 合成,这种组合变量的加权方法是为了达到某个目的,多变量分析技术按照它们各自 要达到的目的不同而有所不同。 变量的线性组合如下:? Y ? a ? b1 x1 ? b2 x 2 ?b3 x3 ? ? ? bk x k1 (公式 3-32)? 其中 Y 是 Y 的预测值。a 是一个常数 X1 到 Xk 是变量项,并且有k个,b 是回归系数。二、使用多元回归的实例 在上述的线性组合中, “重要”的变量对应著较大的标准回归系数。我们举一个 多元回归的例子来说明这一概念,假设我们要从三个变量预测一个人在大学的成绩: 大学本科的平均成绩,教授的评语,以及年龄。这种多变量分析被称为多元回归,它 的目的是要找出三个变量的线性组合,为大学的成绩提供最佳的预测。我们求出了效 标(大学 GPA)与预测源的合成分数(本科 GPA 加教授的评语加年龄)之间的相关,但这 三个预测源的合成分数并不是三个分数的简单相加,我们可以通过统计软件(sps s)将预测源加在一起的特定方式,使得合成分数和效标之间的相关尽可能最高。预 测源的加权合成可能如下: 大学 GPA=0.80(本科 GPA 的 z 分数) +0.24(教授评语的 z 分数) +0.03(年龄的 z 分数) 这个例子说明,在预测大学平均成绩时,大学本科平均成绩比其他变量被赋予更 大的权重, 本科举均成绩乘以 0.8, 而其他变量乘上的系数比较小, 如年龄只乘以 0.03, 几乎不起作用。任何数值乘以 0 都是 0,所以你会发现年龄这个因素几乎可以在等式 中去掉,因为 0.03 乘以任何年龄,z 分数都会得到一个接近于 0 的数字,我们实际上 只是在合成分数中加入了一个 0。 这三个预测源使用 z 分数的原因是:线性等式中的系数受到各变量取值范围的极 大影响。平均成绩是在一个从 0~4 的量表上被测量的,而年龄的分布范围则是 2l~70 岁。为了对系数作相互比较,我们需要把所有变量转化成相同的单位表示,这是透过 z 分数完成的。当变量用 z 分数表示时,回归系数或变量的权重被称为“标准回归系 数” 或 beta)。在有些情况中我们也要使用变量的原始分数,例如:我们想求出一 (b30 个等式,根据某人的品质特征来预测他成功的可能,又不想繁琐地将这些特征分数变 成 z 分数,这时候等式中的权重就称为“原始回归系数” 。 对回归系数的解释要谨慎。除了反映某一变量与效标之间的关系外,回归系数还 受预测源变量之间的关系所影响。当预测变量之间高度相关时,务必非常小心,两个 与效标都高度相关的预测变量,如果它们之间也呈高相关,那它们就不会同时都有大 的回归系数。 例如: 大学本科平均成绩和教授的评语都与大学平均成绩高相关, 但是, 这两个变量互相之间也存在高相关, 两件事实际上看起来是一件事(其实不奇怪, 因为 学生的成绩是教授给的)。 所以教授评语的回归系数可能比较低, 因为它的一部分预测 效力已经透过它与本科平均成绩之间的关联而列入考虑列入了,只有当预测变量不发 生重叠,也就是它们不相关时,我们才有把握对回归系数做出解释。 三、区别分析 多元回归适用在效标是连续变量的时候。然而测验中有很多情况是将效标分成不 同的组别。例如:我们经常想知道能对将成功与失败做出区分的变量线性组合。像这 样找出变量的线性组合,藉以对各组别做出最大区分的多变量数据分析就,称为区别 分析。区别分析涉及到的一种情况就是,要确定一组量数能否预测某一待评估表现的 成功与失败。譬如:先施测很多测验,然后用区别分析找到这些测验的线性组合,以 对成功和失败作最佳的区分。有时候我们要做出的区分超过两个类别,这时我们就要 使用多元区别分析。 区别分析在构建测验时有很多优势,测验构建的一个途径则是,对在其一特质上 代表著截然不同的两种类别的团体做出鉴别。例如:有两组员工,分别为“绩优”和 “绩差” ,对他们实施各种题目,如何用区别分析找出这些题目的线性组合,使之能 最好地解释“绩优”于“绩差”间的区别。借助这样的信息,我们就可以编制测验来 诊断绩效。四、因素分析 区别分析和多元回归分析技巧都是要找出变量的线性组合,以对某一效标做出最 好的预测,而因素分析则抛开效标来研究几个变量的相互关系。我们最好把因素分析 看作是一种数据精减技巧,当面对一大堆题目答案或一大堆测验时,我们希望能把这 些信息简化成几个更易管理的因素。在图 3-1 中早示的是一个二维的散点图,求相关 的任务是要找出穿过这个二维空间的最佳拟合直线。随著我们在多变量分析中加入更31 多的变量,同时也增加了空间的维度。例如:图 3-9 就是一个三维空间图。你可以运 用你的想像力设想一个更大维度的空间会是什么样子,有的人就声称自己能够看见三 维以外的空间,而其他人则做不到。不管怎么样,想像这些点是分布在一个多维空间 上的。 图 3-8 一个三维散点图可以用一个盒子 表现。除了在X和 Y 袖标出点以外,我们还必 须依它们与第三个 Z 轴的关系才能定位。 尽管 在一平面上很难展现出超过二维的空间, 但你 可以把一个三维图想像成盒子. 在因素分析中,首先建立一个矩阵,表示 出每一变量和其他变量的相关, 如何找出变量 的线性组合,对尽可能多的变量关系做出描 述。这些线性组合项被称为“主成分” ,建立它们的目的是要尽可能描述变量之间的 关联。有多少变量就可以找到多少种主成分,但是,每一个主成分是依据数学原理提 取的,它与所有其他的主成分保持独立或不相关联。第一个主成分对于变量之间变异 的描述是最成功的,越在后面的主成分就越不成功。因此,我们通常只检验几个能够 解释绝大部分变异的主成分。更专业地说,主成分分析和真正因素分析的差别在于如 何建立相关矩阵。不过,主成分通常也称为因素。 一旦找到线性组合或主成分后,就能求出原始项目和因素之间的相关,这些相关 被称作“因素负荷量”“项目 7 在因素上负荷高” 。 ,这句话意味著项目7和第一个主 成分之间的相关很高。 透过研究哪些变量在因素上的负荷量高, 便能确定因素的意义。 下面用实例说明在一份人际信任量表中各种因素的意义是如何评定的。 因素分析的实例:信任的因素 罗特(Rotter,1987)介绍了一种测量人际信任的量表,他把信任定义为“个人或团 体持有的一种期望,期望另一个人或另一团体所说的话、作的承诺、口头或文字的声 明能够被依赖”(p.651)。不过,自从这篇最早的关于信任的文章发表以来,已经有 几位学者报告说信任看起来是由几个独立因素构成的(Chun & Campbell, l974; Kaplan, l973; wrlght & Tedeschl, 1975),用来得出这一结论的方法是因素分析。在 每一项研究中都是先在一个大群体中施测项目,如何对结果作因素分析。这一程序使 得大量的项目被减至数目较少的几个因素。因素由原始项目的线性组合而成,为了对32 因素命名,需要对顶目的负荷量,即原始项目与因素之间的相关给予研究。表 3-7 就 是各项目在三个因素上的负荷量(选自 KaDlan,1978)。表 3-7 各项目在三个因素上的负荷量项目序号 项目 负荷因素 Ⅰ Ⅱ Ⅲ -.67 -.54 -.41 .37 -.69 .44 -.67 -.49 -.55 .09 .29 .20 .12 .11 .04 -.22 .13 -.12 -.07 -.12 .02 .09 .23 .18 .17 -0.8 .01 -.04 -.52 .45 .66 .62 .48 .58 -.03 .08 -.01 -.14 -.06 -.06 -.21 .00 .28 -.20 -.00 .24 .28 .08 .07 .20 .20 .36 .16 .74 .45 .53 .57A.在制度信任因素上有高负荷量的项目 4 这个国家前景暗淡,除非我们能吸收更优秀的人士进入政界。 5 人们不做违法乱纪的事并非良心使然,而是害怕来自社会的斥责和惩罚。 13 联合国在维护世界和平上从来不是一种有效的力量。 16 司法制度是我们所有人都能得到公平对待的制度。 19 如果知道大众听到和看到的新闻中有多少是被歪曲过的,多数人都会目瞪口呆。 21 多数被选上的政府官员在他们的竞选承诺中都是诚实的。 24 尽管有报纸、广播和电视,我们还是难以得到公共事务的客观报导。 28 果真的知道了国际政治的内幕,民众会比现在更有理由感到恐惧。 33 很多主要的国家运动比赛被用这种或那种方式固定下来。 B.在诚实因素上有高负荷量的项目 1 我们这个社会有越来越多的伪君子。 12 大多数学校学生不会作弊,即他们肯定可以逃脱惩罚。 2l 我们可以相信,大多数专家承认自己知识的有限性。 34 大多数理想主义者是诚实的,他们总是实践自己所倡导的信条。 38 很多修理工不会高价收费,即使他们知道你对他们的专业一无所知。 44 大多数人诚实地回答民意测验。 C.在谨慎因素上有高负荷量的项目 2 一个人在与陌生人打交道时最好小心,直到陌生人能够提供足够的证据证明他们是可以信任。 7 考试时没有老师监考的制度可能会导致作弊的增加。 32 在这个竞争的时代,你不得不小心,否则就会被别人利用。 42 向保险公司索赔的大部分事故都是假的。 选自Rottcr(1976)一旦获得了因素负荷,研究者就要透过研究哪一变量在因素上的负荷高而对该因 素命名,在这个例子中,如果一个项目在因素上的负荷量大于+0.35 或小于-0.35,那 么这个项目就有助于解释这个因素。在凯普兰研究(1973)中,发现了三个信任因素。 因素Ⅰ:对制度的信任。这表示对于多数社会机构的信任。它包括的项目可能与 政客们的能力有关。例如: “这个国家前景黯淡,除非我们能吸收更优秀的人士进入 政界”(-0.67)。很多项目传达出一种观点,就是政府和媒体对公共活动的误导。例如: 有些高因素负荷的项目是“如果知道大众听到和看到的新闻中自多少是被歪曲过的, 大多数人都曾目瞪口呆。 ”(-0.69);尽管报纸、广播和电视,我们还是难以得到公共事 务的客观报导。(-0.67) 因素Ⅱ:诚实。在诚实这一因素上负荷高的项目集中于对他人诚实的觉察。这些 项目包括“大多数理想主义者是诚实的,他们总是实践自己所倡导的信条” (0.62): 再如“多数人诚实地回答民意测验”(0.58)。几乎所有在第二个因素上负荷高的项目 都是以“大多数”开头的,由于这种宽泛的措辞,人们就有可能对项目表示同意,因 为它们相信一个团体中大多数人都是诚实的,虽然他们仍对这个团体中的一小撮“坏33 蛋”怀有不信任。所以,尽管一个人相信多数汽车修理工都是诚实的,但他还是要自 己修车,因为他怕被骗子索求高价。 因素Ⅲ:谨慎。这一因素包括的项目表达了人们对被他人利用的担心,例如有这 样的项目: “在与陌生人打交道时,一个人最好小心直到陌生人能够提供足够的证据 证明他们是可以信赖的。 ”(0.74),再如“在这个竞争的时代,你不得不小心,否则就 会被别人利用。 ”(0.53)要注意谨慎与上面提到的诚实是无关的。 根据资料显示,广义的信任是多层面的。对临床工作者和研究者来说,信任量表 是一个有用的工具,但如果他们能将问题的焦点集中在信任的具体成分而不是泛泛的 例子上,他们的目的可能会更好地实现。 因素分析是一种复杂而且很专业的方法,一个使用者必须学会它的多种使用格 式。例如:使用者经常会为了把各主成分的意义更清晰地描绘出来,需要用一种方法 转化变量,使得负荷高的因素和负荷低的因素被推向两极。这一转换方法要牵涉到对 因素空间中坐标轴的旋转,因此它被称为“旋转法” 。旋转法有很多种选择格式,而 最初被分析的矩阵的特征也有很多种。如果你有兴趣,可以参考其他心理统计书籍。第四节心理测量理论一、心理测量的性质和水平 1.测量与测量的要素 所谓测量, 就是按一定的法则给事物指派数字。 法则体现在测量的两个要素―― 参照点和单位上。 (1) 参照点参照点有两种,绝对参照点(又称绝对 0 点)和相对参照点(相对 0 点) 。具有 绝对 0 点的事物可以直接测量,如长度、质量等;没有绝对 0 点的事物只能进行间接 测量,如时间和温度。 (2) 单位测量的单位有相等的单位和不等的单位。 2.测量量表与测量的水平 (1)测量量表 测量量表是一个连续体,把要测量的事物放在这个连续体上,看它距离参照点的34 远近(包含多少个单位)给出测量值。如,尺子、称或心理测验的常模表。 (2)测量量表的水平 数字系统具有四个特性:①唯一性;②顺序性;③可加减性;④可乘除性。 测量量表中的数字按具备数字系统特性的多少可以分成从低到高的四个水平:高 高 低 水 平 高命名量表:唯一性 顺序量表:唯一性 顺序性(等级) 等距量表:唯一性 顺序性 可加减性 (没有绝对 0 (没有绝对 0 (没有绝对 0 没有单位 ) 有不等单位) 有相等单位) 有相等单位)高比例量表:唯一性 顺序性 可加减性 可乘除性 (有绝对 0属于命名量表的有考勤册,属于顺序量表的有排名榜,百分制的考试成绩等,属 于等距量表的有时间和温度量表,属于比例量表的有长度测量量表和重量量表等。 3.心理测量的性质与水平 心理测量就是根据一定的法则用数字对人的心理特质或行为水平加以确定。即根 据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。 一般来讲,心理测量的工具是指心理测验,而广义的心理测验可以包括所有心理测量 的工具、技术和程序。比如,它包括纸笔测验、口头测验、绩效测验、面试、等级量 表、评价中心、加权履历表等。美国心理与教育测量学家布朗(F?G?Brown,1983) 认为,测验是“测量一个行为样本的系统程序” 。通俗地讲,心理测验就是通过观察 人的少数有代表性的行为,对贯穿在人的全部行为活动中的心理特点做出推论和数量 化的一种科学手段。 ① 心理测量性质是间接测量科学发展到今天,我们还无法直接测量人的心理,只能测量人的外显行为,也就 是说, 我们只能通过一个人对测验题目的反应来推论出他的心理特质。 特质的概念我 们今后还会经常遇到,因此在这里给出一个定义。所谓特质,是描述一组内部相关或 内在联系的行为时所使用的术语, 是在遗传与环境影响下, 个人对刺激作反应的一种 内在倾向。特质,乃是个体所特有的与他人不同的、稳定的、可分辨的(可与其他特 征分开)的特征。但它又只是一个构想,而不是一个被直接测量到的有实体的个人特 点。由于特质是从行为模式中推论出来的,所以心理测量永远是间接的。有人对间接 测量持怀疑态度,认为测量到的不是所要测的东西。但心理测量学以这样观点为前 提∶人的心理活动与行为具有因果关系,由“果”推“因” ,这是科学研究的基本方35 法之一。 因为心理测量是间接测量, 所以心理测量没有绝对参照点, 在对人的行为作比较 时, 是看每一个人处在人群的什么位置上, 由此测得一个人的智力高低、 兴趣大小等, 都是与其所在团体的大多数人的行为或某种人为确定的标准相比较而言的。 因此, 心 理测量的分数常常采用常模参照或内容参照 (这在后面心理测验一章中会专门讨论) 。 ②、心理测量的水平 一般来说,心理测量是在顺序量表水平上。因为对于人的智力、性格、兴趣、态 度等来说,绝对零点是难以确定的,相等的单位也难以获得。比如说,一个测验包括 50 个难度不同的题目,每题 1 分,我们能否说得 10 分的人与得 15 分的人的差别与 得 45 分与得 50 分的人的差别是相等的?表面看来都是 5 分之差,但仔细考虑一下就 会发现 45~50 分的差别要比 10~15 分的差别大。 因为顺序量表没有相等的单位, 因 此顺序量表所能提供的测量信息非常有限。 为了提高心理测量的水平,心理测量一般通过统计技术将顺序量表提高到等距量 表水平,最常用的转换方法是给顺序量表一个参照点(平均值) ,再给它一个单位(标 准差) ,这样就把属于顺序量表的原始测量分数转换成等距量表分数,这个分数通常 称之为标准分数,最常见的标准分数为 Z 分数。Z? X?X?(公式 3-33)③、心理测量的客观性 客观性是对一切测量的基本要求。 在心理测量中需要控制的变量越多, 要做到客 观性就越不容易。 心理测量的客观性是通过测验的标准化实现的。 测量工具的标准化, 这是对一切测量的共同要求。 心理测验的标准化验经过长期的探索和努力已有了很大 的改进。心理测验的标准化验包括∶测验题目的标准化、验施测程序的标准化、评分 方法的标准化、 分数转换和解释的标准化。 关于测验的标准化问题我们将在后面介绍。二、心理测量的误差种类 误差是由测量中与目的无关的因素引起的不准确或不一致的效应。 心理学研究中的误差按其性质可分为三类,随机误差、系统误差(又称恒定误差)、 过失误差。 (1)随机误差∶又称偶然误差。是由于实验中的一些偶然因素引起'而又不容易36 控制的误差。它包括实验者在观测实验时主观和客观上不可控制的因素造成的误差, 也包括被试的一些偶然的不可控制因素造成的误差,还包括主试、被试以及实验情境 交互作用造成的误差。随机误差产生的原因十分复杂,但其存在是绝对的。随着实验 观测次数的增加,随机误差的变化会呈现一定的规律性,即它总是围绕被观测的真正 值(又称真分数,一般用多次观测的平均值来表示,由于观察条件、仪器等的限制,严 格地说来,真正值是无法测量到的)波动,随机误差的算术平均数随着观测次数的增加 而逐渐减少以至于趋近于零。 (2)系统误差∶就是观测过程中服从确定规律性的误差。由于实验条件不同,造 成不同的有一定规律性的误差属于这类误差。心理学实验中,不同的实验方法、不同 的被试样本等都会对实验结果产生规律性的影响。这类误差不能通过增加实验次数消 除。如果需要可以通过实验设计加以消除,这一问题我们将在后边的变量处理和实验 设计中讨论。 (3)过失误差∶一般把明显歪曲实验结果的误差成为过失误差,它是由于实验观 测过程中的过失造成的。这些错误有测错、传错、记错、仪器失灵、取样错误。在实 验数据整理过程中必须鉴别、舍弃这些含有过失误差的数据(又称异常点),否则会严 重影响实验结果的准确性,得出不正确的结论。 在一组实验数据中,随机误差、系统误差、过失误差总是错综复杂地存在着,因 而造成了观测数据的波动性或变异性。三、心理测量的误差来源 一个测验要准确可靠,就必须控制各种误差,为此首先要了解误差的来源。 根据误差定义,误差是由测量中与目的无关的因素引起的不准确或不一致的效 应。在心理测量中,常见的误差来源于三个方面:测验内部,施测过程,受测者本身。 1.有测验内部引起的误差 测验内部的误差主要来源于题目取样: (1)当测验题目较少或取样缺乏代表性时,被试的反应受机遇影响较大(譬如 一次考试碰巧准备到或没有准备到某题) ;当几个测验复本不等值时,接受不同的题 目,就会获得不同的分数。 (2)除题目取样不当可引起误差外,其他一些因素,如题目用词的模棱两可, 对反应步骤说得不清楚;题目过难引起猜测;时限短使被试仓促做答等,也可能成为37 误差的来源。 2.由施测过程引起的误差 在三种误差来源中,与施测过程有关的误差可能是最容易控制和检验的。通过长 期实践,测验的标准化水平越来越高,大部分施测条件能够得到控制。但由于心理现 象的复杂性,许多意想不到的偶然因素仍可能影响测验分数,使人防不胜防。 (1)物理环境 施测现场的温度、光线、声音、桌面好坏、空间阔窄等皆具有影响。 (2)主试者方面 主试者的年龄、性别、外表,施测时的言谈举止、表情动作等均能影响测验结果。 倘若不存在按照规定实施测验,如制造紧张气氛,给予特别协助货暗示,以及计时错 误等,都会带来较大误差。特别是当测验具有复杂步骤和说明,或测验题目本身是模 糊不确定的形式时;当主试者在安排测验条件上有较多余地(例如个别实施)测时; 当测验是对幼儿、有情绪困扰者以及对测验程序不熟悉的人施测时,主试者的影响更 大。 (3)意外干扰 在测验环境复杂,特别是当受试人数较多时,容易发生出乎意料的干扰或分心事 件。例如:停电、有人生病、有人作弊、计时表停了、临时发现题目或作答纸张印刷 不清或装订错误等,无论哪种情况都会引起不安和扰乱,导致成绩不准确、不一致。 (4)评分计分 评分不客观以及计算登记分数出错也是常见的误差。一般选择题的评分教为客 观。而问答题、论文题等自由反应型的题目,评分标准很难掌握,加之阅卷者的偏好 各不相同,因而难以保证分数的一致性。不仅教师间有此差异,即使是同一个教师受 情绪疲劳、外界干扰、卷面整洁、考试前后位置引起的对比效应以及对学生成见的影 响,标准也可能不统一,甚至同一张试卷隔一段时间再评,前后给分也可能不一致。 至于学校间、地区间的差别就更大了。 为了控制与施测过程有关的误差,主试者必须严格遵循标准化程序施测和评分, 不得任意改动和发挥,同时要机智地处理各种意外情况。 3.由受测者本身引起的误差 即使一个测验经过精心编制,题目取样具有代表性,又有标准化的施测和记分程 序,由于受测者本身的变化,仍然会给测验分数带来误差,这种误差是最难控制的。38 来自受测者的误差因素,有些是属于个人的长期的一般的变化,有些是与特定测验内 容和形式以及特定施测条件相联系的暂时的特殊变化。 (1)应试动机 受测者对测验的动机不同,会影响其作答态度、注意力、持久性、反应速度,以 及回答的真实性等。例如,当人格测验用于选员时,雇佣方感兴趣的是申请者的典型 行为,但申请者为了给雇佣方留好印象,在回答时可能考虑雇主的期望或社会道德等 因素,而不能按自己的真实情况作答,从而给测试结果带来误差。 应试动机对测验成绩的影响表现在各方面,如果动机效应使一个人在反复测量中 以一定的方式进行活动,这便导致系统误差,使测量的有效性降低;如果受试者的动 机引起了偶然性的不稳定的反应,这时一种随机误差,测量的有效性和可信性都会降 低。 (2)测验焦虑 测验焦虑是指受试者在应试和测试中出现的一种紧张的、不愉快的情绪体验。和 一切情绪反应一样,焦虑的产生既有认知因素的作用,也有生理因素的作用。 一般说来,适宜的焦虑会使人的兴奋性提高,注意力增强,提高反应速度,从而 对测验成绩产生积极影响。然而,过高的焦虑却会使工作能力降低,注意力分散,思 维变得狭窄、刻板,记忆中储存的东西提取不出来。但焦虑过低,内驱力过小会使受 测者采取满不在乎的态度,作答不认真而导致成绩降低。焦虑对测验成绩的影响可用 图 3-9 的倒 U 型曲线来表示。高研究表明,测验焦虑受主客观两方面因 素影响: i. 能力和测验焦虑成负相关。 能力高的人, 测验焦虑一般较低,而对自己的能力没低高(焦虑程度)有把握的人,测验焦虑较高。 ii. 抱负水准与焦虑成正比, 抱负水准过高, 求胜心切的人,测验焦虑较高。图 3-9焦虑对测验成绩的影响iii. 患得患失、缺乏自信、情绪不稳、顺应不良的人容易产生测验焦虑。 iv. 经常接受测验的人焦虑较小,而对测验程序不熟悉的人焦虑较高。 v. 测验成绩对被试关系重大,后果严重,或被试受的压力很大时容易产生焦虑。vi. 被试不了解测验的目的,测验的指导语不清,采用了新的题目形式或施测程序以39 及严格事件限制等测验方面的因素,也会增加被试的焦虑。 (3)学习、发展与教育 由一般学习或发展变化引起的测验分数上的差异,在大多数情况下,只构成恒定 误差。但有时,大多数人对于某个侧翼没有准备,只有个别人获得了特殊训练,或在 两次测验间隔中,有的人获得了特殊,训练,而其他人没有,在这种情况下,第二次 测验所得到的分数,既反映了第一次测验时所测量的东西,也反映了在两次测验之间 所学到的东西。由于受测者的训练量不同,他们的分数就会受到不同的影响,而表现 出误差。 (4)测验经验 被试对测验的经验也会影响测验成绩,对测验程序和技能熟练程度不同,所得分 数不能直接比较。 (5)练习效应 任何一个测验在第二次应用时, 都会有练习效应而使成绩提高。 在能力测验方面, 练习效果的研究通常认

我要回帖

更多关于 衡量企业绩效的指标 的文章

 

随机推荐