SEM概述
SEM是一般线性模型的扩展。它能使研究者同时检验一组回归方程。SEM软件不但能检验传统模型,而且也执行更复杂关系和模型的检验,例如,验证性因子分析和时间序列分析。
进行SEM分析的基本途径显示如下:
研究者首先基于理论定义模型,然后确定怎样测量建构,收集数据,然后输入数据到SEM软件中。软件拟合指定模型的数据并产生包括整体模型拟合统计量和参数估计的结果。
分析的输入通常是测量变量的协方差阵,例如调查项目得分,虽然有时使用相关阵或协方差和均值阵。实际上,数据分析经常用原始数据提供给SEM,程序转换这些数据为它自身使用的协方差和均值。
模型由测量变量间的关系组成。然后,这些关系表示所有可能关系的限制。
结果有模型拟合的全部指数以及参数估计,标准误,模型中自由参数的检验统计量。
SEM术语
SEM有其自身的语言。一般来讲统计方法有这种特性,但SEM用户和创建者似乎为这种方法发明了一个特殊的语言。
自变量,假设没有测量误差的,称为外生变量;因变量或中间变量被称作为内生变量。
观测变量直接由研究者测量,而潜在或不可观测变量不能直接测量但可由分析中测量变量的相关性或关联推断。统计估计可由多种方式实现,探索性因子分析从观测变量的共享方差中推断潜在因子的存在。
SEM用户使用路径图表示观测和非观测变量间的关系。椭圆或圆形表示潜在变量,而长方形或方形表示测量变量。残差总是非观测的,所以它们用椭圆或圆形表示。
下图所示,相关系数和协方差由双向箭头表示,表示没有明确定义因果方向的关系。例如F1和F2是有关的或相关的,但没有声称F1导致F2,反之亦然。
相反,我们声称F1引起测量变量I1和I2上的观测得分。因果效应在路径图中由单箭头表示。F1和F2被两个指示因子共享的方差概念化(例如,两个指示因子共有什么。)至今为止正如所猜测的那样,F1和F2是潜因子;I1到I4是观测变量。也许它们是调查项。E1到E4是I1到I4中引起响应方差的残差或误差方差。路径图告诉我们1到4的得分或调查响应项是由两个相关因子及每项的唯一方差引起的。部分唯一方差或许是由于测量误差。
路径图中一部分路径被标上数字“1”。意思是这些路径系数设为固定值为1。必须要包括这些固定值:它们设置潜在因子和残差的测量尺度。另一种选择是,把因子方差设置为1以获得固有的标准解。注释:当执行多组分析时不应该使用后一种方法。
为什么使用SEM?
如后面所见,研究者为什么想使用SEM和必需用它自己的语言处理一些相当严格的统计假设?SEM有许多吸引人的优点:
假设潜在的统计分析是明确的和可检验的,调查者能全部控制和进一步地分析理解。
绘图接口软件创造性地推进和使快速调式模型变得容易(这个特性取决于所选的SEM软件)。
SEM程序同时提供总体模型检验和独立参数估计检验。
回归系数,均值和方差同时被比较,即使多个组间交叉。
测量和验证性因子分析模型能净化误差,使得潜变量间的关联估计较少地被测量误差污染。
拟合非标准模型的能力,包括灵活处理追踪数据,带自相关误差结构的数据库(时间序列分析),和带非正态分布变量和缺失数据的数据库。
SEM的最后特征是它最具吸引人的性质。SEM提供统一的架构,多个线性模型能使用灵活,功能强大的软件拟合。 |