1、1、 研究方法之哲学信仰 进化知识论(重要知识点)以波普尔(Karl R. Popper, 1902-1994)提出的进化认识论为代表。他主张科学方法应当是以理性批判为基础的演绎推理。科学家先针对特定问题提出假说和猜想,再依据事实对假设进行检验,并在检验过程中不断修正原有的假设和猜想。其进化认识论如下图(波普尔的四段图示)所示: 科学哲学的转向 在科学理论的场合,问题的产生通常是出自于下列三种不同情景:(1)理论与观察或实验的结果不一致;(2)理论系统内不发生相互矛盾的现象;(3)两个不同理论之间的相互冲突。 进化论与逻辑实证论的区别知识论方面,进化认识论不像逻辑实证论那样,采用“逻辑图像论”
2、只以精确地描绘世界图像为满足,而主张要建构理论来解释人们所观察到的事实或现象。 本体论方面,进化认识论认为:科学家为了解释事实或现象,在建构理论时必须提出各种形而上的概念,这种形而上的假设建构,不是一种虚构,而是一种“实在”。 方法论方面,正因为科学理论是科学家建构出来的,而不是“描绘世界的图像”,因此进化认识论在方法论方面主张“证伪论”,认为科学家的主要任务并不是在于“证实”命题,而是在于“证伪”理论中的命题,他们认为:一个科学的理论必须具有“可证伪性”。 科学哲学总结 1. 实证主义:极端经验论(实证) 2. 逻辑实证论:极端经验论(实证)、逻辑图像论(反对形而上) 3. 后实证主义(进化
3、认识论):理论建构(形而上)、实证(非极端经验论)、可证伪性 A Simplified Scientific Research Processand Types of Research Elements of the Scientific Process 二、科学研究过程 检验假设的研究(演绎法)遵循图 1 右半部分的流程。 建立理论的研究(归纳法)遵循图 1 左半部分的流程。 检验假设的数据收集方法包括调查问卷(邮件、网络、电话或访谈)、实验(大学环境下)、准实验(组织中)以及二手数据(财务、生产或人事记录)。 归纳法通常涉及定性数据,如访谈、参与性或非参与性的观察、现有文件的分析 案例研究
4、方法包括这些方法的结合。 循环的上半部分指逻辑的方法,或称通过归纳和演绎逻辑实现理论化的过程。 循环的下半部分指实证的方法,或称其为在研究方法的帮助下从事研究。 三、理论或模型中的变量类型 理论解释了一个现象“是什么”(what)、“怎么形成”(how)、“为什么”(why)、“何时”(when)以及“谁”(who)等问题。 在管理和组织主流理论中,典型的理论如:代理理论(Jensen Fama Burt, 1992; Granovetter, 1973)、社会交换理论( Blau, 1964)。 理论模型中包括五类变量,如下图。 三、理论或模型中的变量类型 自变量:是因变量假定的原因,为先行
5、变量。 因变量:假定的效果,为结果变量。 控制变量:对因变量有影响,且需要被消除(1.之前理论发现; 2.条件;3.混淆变量)。 调节变量:影响自变量和因变量关系的方向、强度的定性或定量的变量。 中介变量:是介于自变量和因变量之间的变量。 一个理论必须详细地说明自变量、因变量、中介变量和调节变量的关系。 实证研究的一般过程 科学研究的主要目标是,探讨变量间因果关系。 实证研究过程可如下图所示: 在图 1 中,线( a)代表两个抽象构念 X和 Y之间的理论关系。我们需要检验的研究假设是 X和 Y之间是否存在因果关系。 由于现实世界中,我们无法直接观察这些抽象的构念( X和 Y),所以首先要将它们
6、操作化为可以测量的变量(图 1 中的 X 和 Y)。其中线(b1)、(b2)代表操作化过程。 然后,通过搜集资料并运用合适的统计方法来验证 X 和 Y 之间是否存在统计上显著的关系(如线(d)所示)。 如果没有发现 X 和 Y 之间的显著关系,就可推断构念 X和 Y之间不存在显著的关系。 如果发现了 X 和 Y 之间的显著关系,则还需要提出各种可能导致 X 和 Y 之间发生因果联系的替代解释,之后才能推断 X 和 Y 之间存在因果关系。 经过这番检验后,如果我们有足够的信心推断 X 和 Y 之间存在因果关系(如线(c)所示),我们就可以接受研究假设,推断构念 X和 Y之间存在因果关系。 最后,
7、我们还要考虑样本所处的特定时空(时间、空间、研究参与者等情景因素)对所获得的研究结论的影响,推论研究结论是否在其他情景下也能成立。 四种效度:评价实证研究质量的方法 四种效度:构念效度、统计结论效度、内部效度、外部效度(Cook 陈昭全、张志学, 2008):深化(elaboration)、繁衍(proliferation)、竞争(competition)、整合(integration)。 1. 深化是指研究者在已有理论基础上增加一些新的成分,使原来的理论更全面、更具体、更精确、更严谨。新建立的理论并没有挑战或者背离原有理论的假定和原理。 例子:Xiao O),即员工得分的差异 包括:(1)真
8、实差异 (True Variance;T) (2)影响测量方法的独有因素带来的差异(Unique Variance;U)(3)随机误差带来的差异(Error Variance;E) O = T + U + E 信度(reliability) (1) E 占 O 的比重(2) 因为 E 是随机的,信度为测量的工具免于随机误差的程度 (3) 测量结构的一致性或稳定性 信度系数的估計:为了与统计上的相关系数看齐,我们一般会取两次测量的共变量比例的平方根,来估计信度 ,称之为信度系数(reliability coefficient)。 信度系数的方程式信度系数 = 任何一种测量,尤其是关于社会科学的概
9、念,总有或多或少的随机误差,不可能百分百稳定。这些误差受随机因素所支配,误差愈小,信度越高;误差愈大,信度越低。例如,在我们离职倾向的例子中,员工测试时的心情、当时的状态、测试的环境等随机因素可能影响测试结果。 信度(reliability) 的估计 - 两次测量的相关系数:(a)再测信度(test-retest reliability) ,同一群受试者,前后测量两次,再根据两次测试的分数计算相关系数。 (b)复本信度(alternative forms reliability) ,如果一套测验有两套以上的复本,则可交替使用,根据一群受试者接受两种复本测验的得分计算相关系数。 (c)折半信度
10、(split-half reliability) ,将受试者的测验结果,按题目的单双数分成两半计分,再根据各人在这两半测验上的分数,计算其相关系数。 (d)项目间一致性信度(internal consistency reliability) ,项目之间的相关程度,常用估计是Coefficient alpha; (SPSS “reliability” 的指令)。计算公示为 (K*Rij)/1+(K-1)Rij,其中 K是测量项目的数目,Rij 是所有项目之间的相关系数的平均。 (e)评分者信度(inter-rater reliability),不同评分者之间的相关系数,例如工作表现既可由主管评定
11、,也可由同事评定。 - 一般来说信度系数要在 0.7 以上 信度对验证构念之间关系的影响 假设在验证两个构念的关系时,测量工具极为理想,以至于两个工具的独有变异量 U 都等于零,即 O=T+E。下图展示了两个构念经测量后变异量及共变量的关系。 两个构念观察所得的相关系数 把 R0除以 r1 及 r2 的平方根,便可求得 Rt Rt 与 Ro的关系(Correction for Attenuation) 影响信度的主要因素(1) 受测量者方面:受测试者可能因生病、疲劳或其他如情绪等因素而影响其测量结果。 (2) 主持测量者方面 :主持测量者可能带来的随机差异,例如主持者如果对不同的研究对象持不同
12、的态度,便可影响测量结果。 (3) 測量内容方面 :测量项目如果不清楚,或可作不同解释,或指示不清楚,会带来随机误差。 (4) 測量情境方面 :测量环境如温度、灯光、空气等均可能影响测量结果。 (5) 时间影响方面 :测量项目过多或过少有可能降低信度,过多会导致疲劳效应,过少可能使受测试者轻视测量等。 效度(validity)的概念 (1) 测量结果是否正确,便是效度(validity) 问题 (2) 从 O=T+U+E 的方程式来理解,效度是指 T 占 O 的比重 由于信度系数一定小于 1,所以这个方程式说明了我们通过有随机误差的测量工具来验证构念间关系时,往往会做出较保守的估计。 这一方程
13、式也可作为更正此一低估之用。 (3) 信度是效度的必要条件,而非充分条件 (4) 检验效度的主要方法,最好是检验构念间的关系网(nomological network) ,即此构念在理论上与其他构念的关系状况。 检验效度的方法(1) 内容效度(content validity) ,即从测量的具体内容是否合适。例如,我们应仔细检查离职意向构念的三个题项,确保它们真的是在询问员工构念这一问题。 (2) 效标关联效度(criterion-related validity):用我们已知与此欲测量构念有关的另外一些构念作为效标,考察他们之间的相关系数。 - 同时效度(concurrent validit
14、y); 同时 - 预测效度(predictive validity); 之后 - 增加效度(incremental validity) ;新的构念作为效标 (3) 建构效度 (construct validity): 测量工具测量构念的程度 - 聚合效度(convergent validity); 以不同方法测量同一构念,其结果应该相吻合。 - 区别效度(discriminant validity);以相同方法测量不同的构念,其结果应该不同。 多元特质和多重方法矩阵(multitrait-multimethod matrix) 多元特质和多重方法矩阵的分析(1) 比较各相关系数的大小(2) C
15、FA:C1 的因子:M1C1,M2C1,M3C1C2 的因子:M1C2,M2C2,M3C2C3 的因子:M1C3,M2C3,M3C3M1 的因子 :M1C1,M1C2,M1C3M2 的因子 :M2C1,M2C2,M2C3M3 的因子 :M3C1,M3C2,M3C3(3)构念因子(C1、C2、C3 )占总变异量的比重越大越好,方法因子(M1 、M2、M3)占总变异量的比重越小越好。 影响效度的主要因素 (1) 测量工具方面,例如在组成上如果我们先问研究对象的某些态度,很可能使他们原来不注意的事变得清晰,因此再问其他问题时,他们的反应便有别于一般情况。 (2) 测量实施方面,在实施测量时,给予研究对象的指引、环境的安排等都有可能影响效度。 (3) 受测者反应方面,一些问题可能是受测者不愿回答的,例如一些与社会道德有关的问题。 (4) 效标方面,在估计效度时,我们的效标选用不当,或者在测量这些效标时有很大的偏差。 (5) 样本方面,研究样本如果有独特的特质,可能使测量的工具无效。如以西方社会背景设计的“智能测验”,对于东方人或亚洲人的样本便不一定有效。