文档视界 最新最全的文档下载
当前位置:文档视界 › 多因素方差分析讲解

多因素方差分析讲解

多因素方差分析讲解
多因素方差分析讲解

多因素方差分析

定义:

多因素方差分析中的控制变量在两个或两个以上,研究目的是要分析多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否对结果产生了显著影响。

前提:

1总体正态分布。当有证据表明总体分布不是正态分布时,可以将数据做正态转化。

2变异的相互独立性。

3各实验处理内的方差要一致。进行方差分析时,各实验组内部的方差批次无显著差异,这是最重要的一个假定,为满足这个假定,在做方差分析前要对各组内方差作齐性检验。

多因素方差分析的三种情况:

只考虑主效应,不考虑交互效应及协变量;

考虑主效应和交互效应,但不考虑协变量;

考虑主效应、交互效应和协变量。

一、多因素方差分析

1选择分析方法

本题要判断控制变量“组别”和“性别”是否对观察变量“数学”有显著性影响,而控制变量只有两个,即“组别”、“性别”,所以本题采用双因素分析法,但需要进行正态检验和方差齐性检验。

2建立数据文件

在SPSS17.0中建立数据文件,定义4个变量:“人名”、“数学”、“组别”、“性别”。控制变量为“组别”、“性别”,观察变量为“数学”。在数据视图输入数据,得到如下数据文件:

3正态检验(P>0.05,服从正态分布)

正态检验操作过程:

“分析”→“描述统计”→“探索”,出现“探索”窗口,将因变量“成绩”放入“因变量列表”,将自变量“组别”、“性别”放入“因子列表”,将“人名”放入“标注个案”;

点击“绘制”,出现“探索:图”窗口,选中“直方图”和“带检验的正态图”,点击“继续”;点击“探索”窗口的“确定”,输出结果。

因变量是用户所研究的目标变量。因子变量是影响因变量的因素,例如分组变量。标注个案是区分每个观测量的变量。

带检验的正态图(Normality plots with test,复选框):选择此项,将进行正态性检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图。

正态检验结果分析:

表1 控制变量为“组别”的正态性检验结果,Shapiro-Wilk的p值0.884、0.793、0.343都大于0.05,因而我们不能拒绝零假设,也就是说没有证据表明各组的数据不服从正态分布(检验中的零假设是数据服从正态分布)。即p值≥0.05,数据服从正态分布。

表2 控制变量为“性别”的正态性检验结果,Shapiro-Wilk的p值0.165、0. .575都大于0.05,

因而我们不能拒绝零假设,也就是说没有证据表明各组的数据不服从正态分布(检验中的

零假设是数据服从正态分布)。即p值≥0.05,数据服从正态分布。

情况一只考虑主效应:(包括4、5步)(区别用下划线)

4多因素方差分析操作过程

“分析”→“一般线性模型”→“单变量”,出现“单变量”窗口,将因变量“成绩”放入“因变量列表”(因变量只能选一个),将自变量“组别”和“性别”放入“固定因子”列表;点击“模型”,出现“单变量:模型”窗口,点击“设定”,在“构建项”选择“主效应”,将“组别”和“性别”分别放入“模型”列表,点击“继续”,回到主对话框;点击“绘制”,出现“单变量:轮廓图”,将“组别”放入“水平轴”,将“性别”放入“单图”,点击“添加”,点击“继续”,回到主对话框;点击“两两比较”,将“组别”和“性别”放入“两两比较检验”列表,选择“LSD”和“S-N-K” 、“Dunnett’s C”,点击“继续”,回到主对话框;点击“选项”选择“方差同质性检验”和“描述性”,点击“继续”,回到主对话框;点击“单变量”窗口的“确定”,输出结果。

5多因素方差分析结果分析

表1 主体间因子

N

组别 1 10

2 10

3 10 性别0 15

1 15

齐,事后多重比较用“Dunnett’s C ”;S-N-K法多重比较结果为无差别表达方式,即把差别没有显著性意义的比较组在同一列里)

,说明“组别”的主效应极显著;

有显著性差异。

SNK法多重比较结果是把差别没有显著性意义的比较组在同一列里,有差异的放在不同列里。每一列最下面有一个“显著性”P值,表示列内部水平的差异的P值;检验水准α=0.05,不同列间差异有显著意义,同列间各组差异无显著意义。

我的前三个浓度之间无显著差异,倒数2-5个浓度之间无差异。

情况二考虑交互效应:(包括4、5步)(区别用下划线)

4多因素方差分析操作过程

“分析”→“一般线性模型”→“单变量”,出现“单变量”窗口,将因变量“成绩”放入“因变量列表”(因变量只能选一个),将自变量“组别”和“性别”放入“固定因子”列表;点击“模

型”,出现“单变量:模型”窗口,点击“设定”,在“构建项”选择“交互效应”,将“组别”和“性别”分别放入“模型”列表,再同时选定“组别”和“性别”放入“模型”列表,点击“继续”,回到主对话框;点击“绘制”,出现“单变量:轮廓图”,将“组别”放入“水平轴”,将“性别”放入“单图”,点击“添加”,点击“继续”,回到主对话框;点击“两两比较”,将“组别”和“性别”放入“两两比较检验”列表,选择“LSD”和“S-N-K” 、“Dunnett’s C”,点击“继续”,回到主对话框;点击“选项”选择“方差同质性检验”和“描述性”,点击“继续”,回到主对话框;点击“单变量”窗口的“确定”,输出结果。

5多因素方差分析结果分析

表1 主体间因子

N

组别 1 10

2 10

3 10

性别0 15

1 15

表4 主体间效应的检验,“组别”P=0.000<0.01,说明“组别”的主效应极显著;“性别”P=0.394>0.05,说明“性别”的主效应不显著;考虑“性别”和“组别”的交互效应,P=0.301>0.05,说明“组别”和“性别” 的交互相应不显著。由于“性别”只有两个水平,所以没有“性别”的事后多重比较。

单因素方差分析和多因素方差分析简单实例

单因素方差分析实例 [例6-8]在1990 年秋对“亚运会期间收看电视的时间”调查结果如下表所示。 问:收看电视的时间比平日减少了(第一组)、与平日无增减(第二组)、比平日增加了(第三组)的三组居民在“对亚运会的总态度得分”上有没有显著的差异?即要检验从“态度”上看,这三组居民的样本是取自同一总体还是取自不同的总体 在SPSS 中进行方差分析的步骤如下: (1)定义“居民对亚运会的总态度得分”变量为X(数值型),定义组类变量为G(数 值型),G=1、2、3 表示第一组、第二组、第三组。然后录入相应数据,如图6-66所示 图6-66 方差分析数据格式 (2)选择[Analyze]=>[Compare Means]=>[One-Way ANOVA...],打开[One-Way ANOVA]主对 话框(如图6-67所示)。从主对话框左侧的变量列表中选定X,单击按钮使之进入[Dependent List]框,再选定变量G,单击按钮使之进入[Factor]框。单击[OK]按钮完成。

图6-67 方差分析对话框 (3)分析结果如下: 因此,收看电视时间不同的三个组其对亚运会的态度是属于三个不同的总体。 多因素方差分析 [例6-11]从由五名操作者操作的三台机器每小时产量中分别各抽取1 个不同时段的产 量,观测到的产量如表6-31所示。试进行产量是否依赖于机器类型和操作者的方差分析。

SPSS 的操作步骤为: (1)定义“操作者的产量”变量为X(数值型),定义机器因素变量为G1(数值型)、操作 者因素变量为G2(数值型),G1=1、2、3 分别表示第一、二、三台机器,G2=1、2、3、4、5 分别表示第1、2、3、4、5 位操作者。录入相应数据,如图6-68所示。 图6-68 双因素方差分析数据格式 (2)选择[Analyze]=>[General Linear Model]=>[Univariate...],打开[Univariate]主对话框(如图6-69所示)。从主对话框左侧的变量列表中选定X,单击按钮使之进入[Dependent List]框,再选定变量G1 和G2,单击按钮使之进入[Fixed Factor(s)]框。单击[OK]按钮

多因素方差分析

多因素方差分析 1. 基本思想:用来研究两个及两个以上控制变量是否对观测变量产生显著影响。可以分析多个控制变量单独作用对观测变量的影响(这叫做主效应),也可以分析多个控制因素的交互作用对观测变量的影响(也称交互效应),还可以考虑其他随机变量是否对结果产生影响,进而最终找到利于观测变量的最优组合。 根据观测变量(即因变量)的数目,可以把多因素方差分析分为:单变量多因素方差分析(也叫一元多因素方差分析) 与多变量多因素方差分析(即多元多因素方差分析)。 一元多因素方差分析:只有一个因变量,考察多个自变量对该因变量的影响。例如,分析不同品种、不同施肥量对农作物产 量的影响时,可将农作物产量作为观测变量,品种和施肥量作为控制变量。利用多因素方差分析方法,研究不同品种、不同施肥量是如何影响农作物产量的,并进一步研究哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。 多元多因素方差分析:是对一元多因素方差分析的扩展,不仅需要检验自变量的不同水平上,因变量的均值是否存在差异,而且要检验各因变量之间的均值是否存在差异。例如,用四个班级学生分别对两种教材、两种教学方法进行试验,除了要考虑着两种教材、两种教学方法的四种搭配以外,还要考虑四个班级学生的学习能力这些因素。 2. 原理:通过计算F统计量,进行F检验。F统计量是平均组间平方和与平均组内平方和的比。 尸$控制您童H 卜尸6小=的机竇量 这里,把总的影响平方和记为SST它分为两个部分,一部分是由控制变量引起的离差,记为SSA组间离差平方和),另一部分是由随机变量引起的SS(组内离差平方和)。即SST=SSA+SS组间离差平方和SSA是各水平均值和总体均值离差的平方和,反映了控制变量的影响。组内离差平方和是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。 通过F值看出,如果控制变量的不同水平对观测变量有显著影响,那观测变量的组间离差平方和就大,F值也大;相反, 如果控制变量的不同水平没有对观测变量造成显著影响,那组内离差平方和就比较大,F值就比较小。 同时,SPSS还会依据F分布表给出相应的相伴概率值sig。如果sig小于显著性水平(一般显著性水平设为0.05、0.01、或者 0.001 ),则认为控制变量不同水平下各总体均值有显著差异,反之,则不然。一般地,F值越大,则sig值越小。 3. 具体实现步骤: 我们现在有一个公司员工的工资表,想看一下员工性别“gender”与接受教育年限“ edu”这两个控制变量对员工“当 前工资"的影响。采用多因素方差分析法,则要分别考虑“gender”、"edu"对"当前工资”的影响,称为主效应,还要考虑“gender*edu” 对“当前工资”的影响,称为交互效应。 ⑴将数据导入SPSS后,选择:分析->一般线性模型->单变量

多因素方差分析

多因素方差分析 多因素方差分析是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著 表5-7 不同温度与不同湿度粘虫发育历期表 数据保存在“DATA5-2.SAV”文件中,变量格式如图5-1。

1)准备分析数据 在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输数值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。 图5-6 数据输入格式 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因素方差分析设置窗口如图5-7。

图5-7 多因素方差分析窗口 3)设置分析变量 设置因变量:在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。 设置因素变量:在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量存容量的限制,选择的因素水平组合数(单元数)应该尽量少。 设置随机因素变量:在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量 设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。 设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。 4)选择分析模型 在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。 图5-8 “Univariate Model” 定义分析模型对话框

多因素方差分析讲解

多因素方差分析 定义: 多因素方差分析中的控制变量在两个或两个以上,研究目的是要分析多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否对结果产生了显著影响。 前提: 1总体正态分布。当有证据表明总体分布不是正态分布时,可以将数据做正态转化。 2变异的相互独立性。 3各实验处理内的方差要一致。进行方差分析时,各实验组内部的方差批次无显著差异,这是最重要的一个假定,为满足这个假定,在做方差分析前要对各组内方差作齐性检验。 多因素方差分析的三种情况: 只考虑主效应,不考虑交互效应及协变量; 考虑主效应和交互效应,但不考虑协变量; 考虑主效应、交互效应和协变量。 一、多因素方差分析 1选择分析方法 本题要判断控制变量“组别”和“性别”是否对观察变量“数学”有显著性影响,而控制变量只有两个,即“组别”、“性别”,所以本题采用双因素分析法,但需要进行正态检验和方差齐性检验。 2建立数据文件 在SPSS17.0中建立数据文件,定义4个变量:“人名”、“数学”、“组别”、“性别”。控制变量为“组别”、“性别”,观察变量为“数学”。在数据视图输入数据,得到如下数据文件: 3正态检验(P>0.05,服从正态分布) 正态检验操作过程: “分析”→“描述统计”→“探索”,出现“探索”窗口,将因变量“成绩”放入“因变量列表”,将自变量“组别”、“性别”放入“因子列表”,将“人名”放入“标注个案”; 点击“绘制”,出现“探索:图”窗口,选中“直方图”和“带检验的正态图”,点击“继续”;点击“探索”窗口的“确定”,输出结果。 因变量是用户所研究的目标变量。因子变量是影响因变量的因素,例如分组变量。标注个案是区分每个观测量的变量。 带检验的正态图(Normality plots with test,复选框):选择此项,将进行正态性检验,并生成正态Q-Q概率图和无趋势正态Q-Q概率图。

第一节方差分析原理.doc

第一节方差分析原理 一、方差分析基本思想 方差分析( analysis of variance ,或缩写 ANOVA )又称变异数分析,是一种应用非常广 泛的统计方法。其主要功能是检验两个或多个样本平均数的差异是否有统计学意义,用以推断它们的总体均值是否相同。它是真正用来进行上述“多组比较”问题的正确方法,从这个意 义上说,它可看成是t 检验等“两组比较法”的推广。理解方差分析的原理,主要在于其基本思想,而不在于数学推导。 以单因素完全随机化实验设计为例(这是最简单的多组实验设计)介绍方差分析的原理。注意下面列出的该种设计的数学模式,假设有 k 个处理,每个处理下有n 个被试,一共有nk 个被试。 K 个处理下的数据构成比较中的k 个组或 k 个样本。 理T 1 T 2 ?T j ?T k X 11 X 12 ?X 1j ?X 1k X 21 X 22 ?X 2j ?X 2k 各?????? 数据X i1 X i2 ?X ij ?X ik ?????? X n1 X n2 ?X nj ?X nk 不失一般地,其对应的图示如下:

根据测量学中的真分数理论,观测值等于真值和误差之和;据此,对照上面的数据可得到下面的数学模型: 其中: X ij 指第 j 个处理下的第 i 个被试的实验数据; μ 指总体均值;在图中样本数据中,即红色线表示的总平均; μ 指第 j 个处理的均值; j τ 称为第 j 个处理的效应;通常,τj=μj–μ,也即各组均值偏离总平均的离差; j ε ij 为随机误差( idd 表示误差独立同分布);在该模型中,误差就是各组中数据偏离 其组均值的离差。因为根据单因素完全随机化设计的特点,同组中的被试,其各方面条件都相同,接受的处理也相同,其观测值间的差异只能归结为随机误差。 首先对检验的零假设进行变换: 下面我们就需要构造一个统计量使得它在Ho"下无未知量且有精确的分布,以进行假设2 检验。由于τj是每个处理的平均数与总平均之差,所以我们考虑从数据的离均差的平方 入手来构造统计量: 对每个观测数据: 即:任意一个数据与总平均数的离差= 该数与所在组平均数的离差+ 所在组的平均数与总平均数的离差。 我们针对第j 组中每个数据的上述分解式的平方求和得:

多因素方差分析资料讲解

多因素方差分析 是对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此独立。因素变量是分类变量,可以是数值型也可以是长度不超过8的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。 表5-7 不同温度与不同湿度粘虫发育历期表

1)准备分析数据 在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6所示。或者打开已存在的数据文件“DATA5-2.SAV”。 图5-6 数据输入格式 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。 图5-7 多因素方差分析窗口 3)设置分析变量 设置因变量:在左边变量列表中选“历期”,用向右拉按钮选入到“Dependent Variable:”框中。

两因素及多因素方差分析

第九章两因素及多因素方差分析 9.1双菊饮具有很好的治疗上呼吸道感染的功效,为便于饮用,制成泡袋剂。研究不同浸泡时间和不同的浸泡温度对浸泡效果的影响,设计了一个两因素交叉分组实验,实验结果(浸出率)见下表[52]: 浸泡温度 /℃ 浸泡时间/min 101520 6023.7225.4223.58 8024.8428.3229.55 9530.6431.5832.21 对以上结果做方差分析及Duncan检验。该设计已经能充分说明问题了吗?是否还有更能说明问题的设计方案? 答:无重复二因素方差分析程序及结果如下: options linesize=76 nodate; data hermed; do temp=1 to 3; do time=1 to 3; input effect @@; output; end; end; cards; 23.72 25.42 23.58 24.84 28.32 29.55 30.64 31.58 32.21 ; run; proc anova; class temp time; model effect=temp time; means temp time/duncan alpha=0.05; run; The SAS System Analysis of Variance Procedure Class Level Information Class Levels Values TEMP 3 1 2 3 TIME 3 1 2 3 Number of observations in data set = 9 The SAS System Analysis of Variance Procedure Dependent Variable: EFFECT Sum of Mean Source DF Squares Square F Value Pr > F

SPSS多因素方差分析

体育统计与SPSS读书笔记(八)—多因素方差分析(1) 具有两个或两个以上因素的方差分析称为多因素方差分析。 多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方差分析的时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示,那又多了一个时间的因素。如果每个年级都是不同的老师来上,那又多了一个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑,并确定自己只研究哪些因素。 下面用例子的形式来说说多因素方差分析的运用。还是用前面说单因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级和不同教学法班级双因素。 分析: 1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格都是有重复数据(也就是不只一个数据), 年级 不同教学方法的班级 定性班 定量班 定性定量班 五年级 (班级每个人) (班级每个人) (班级每个人) 初中二年级 (班级每个人) (班级每个人) (班级每个人) 高中二年级 (班级每个人) (班级每个人) (班级每个人) 2.因为有重复数据,所以存在在数据交互效应的可能。我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的影响不同,则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视,则常会掩盖因素的主效应的显著性,另一方面,如果对因变量Y,因素A与B之间存在交互作用,则已说明这两个因素都Y对有影响,而不管其主效应是否具有显著性。在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。在大多数场合,交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里假设他们之间有交互作用。

spss多因素方差分析例子

1, data0806-height 是从三个样方中测量的八种草的高度,问高度在三个取样地点,以及 八种草之间有无差异?具体怎么差异的? 打 开 spss 软 件 , 打 开 data0806-height 数 据 , 点 击 Analyze->General Linear Model->Univariate 打开: 把 plot 和 species 送入 Fixed Factor(s) ,把 height 送入 Dependent Variable ,点击 Model 打开: 选择 Full factorial , Type III Sum of squares , Include intercept in model (即 全部默认选项) ,点击 Continue 回到 Univariate 主对话框,对其他选项卡不做任何选 择, 结果输出: 因无法计算 ???? ??rror ,即无法分开 ???? intercept 的影响,无法进行方差分析, 重新 Analyze->General Linear Model->Univariate 打开: 选择好 Dependent Variable 和 Fixed Factor(s) 点击Custom,把主效应变量 species 和plot 送入 Model 框,点击 Continue 回到Univariate 主对话框,点击 Plots : 把 date 送入 Horizontal Axis ,把 depth 送入 Separate Lines ,点击 Add ,点击 Continue 回到 Univariate 对话框,点击 Options : 把 OVERALL,species, plot 送入 Display Means for 框,选择 Compare main effects , Bonferroni ,点击 Continue 回到 Univariate 对话框, 输出结果: 可以看到: SS species =, df species =7, MS species= ;SS plot =, df plot =7, MS plot= ;SS error =, df error =14, MS error= ; Fspecies= , p=<;Fplot=,p=<; 所以故认为在 5%的置信水平上,不同样地,不同物种之间的草高度是存在差异的。 该表说明: SSspecies= ,dfspecies=7 ,MSspecies= ;SSerror= ,dferror=14 ,MSerror= ; Fspecies= , p=<; 物种间存在差异: SSplot= , dfplot=7 , MSplot= ; SSerror= , dferror=14 , MSerror= ; Fplot=,p=<; 不同的物种间在差异: 由边际分布图可知:类似结论:草的高度在不同样地的条件之间有差异( Fplot=,p=< ),具 体是,样地一和样地三之间存在的差异最大;八种不同草的高度也存在差异( Fspecies= , p=<),具体是第四 和 ???? error ,无法检测 interaction ,点击 Model 打开:

SPSS统计分析教程-多因素方差分析

SPSS统计分析教程-多因素方差分析 多因素方差分析是对一个变量是否受一个或多个因素或变量影响而进行的方差分析。SPSS 调用“Univariate”过程,检验不同水平组合之间因变量均数,由于受不同因素影响是否有差异的问题。在这个过程中可以分析每一个因素的作用,也可以分析因素之间的交互作用,以及分析协方差,以及各因素变量与协变量之间的交互作用。该过程要求因变量是从多元正态总体随机采样得来,且总体中各单元的方差相同。但也可以通过方差齐次性检验选择均值比较结果。因变量和协变量必须是数值型变量,协变量与因变量不彼此。因素变量是分类变量,可以是数值型也可以是长度不超过8 的字符型变量。固定因素变量(Fixed Factor)是反应处理的因素;随机因素是随机地从总体中抽取的因素。 [例子] 研究不同温度与不同湿度对粘虫发育历期的影响,得试验数据如表5-7。分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。 表5-7 不同温度与不同湿度粘虫发育历期表相对湿度(%) 温度℃ 重复 1 2 3 4 100 25 91.2 95.0 93.8 93.0 27 87.6 84.7 81.2 82.4 29 79.2 67.0 75.7 70.6 31 65.2 63.3 63.6 63.3 80 25 93.2 89.3 95.1 95.5 27 85.8 81.6 81.0 84.4 29 79.0 70.8 67.7 78.8 31 70.7 86.5 66.9 64.9 40 25 100.2 103.3 98.3 103.8 27 90.6 91.7 94.5 92.2 29 77.2 85.8 81.7 79.7 31 73.6 73.2 76.4 72.5 数据保存在“DATA5-2.SAV”文件中,变量格式如图 5-1。 1)准备分析数据在数据编辑窗口中输入数据。建立因变量历期“历期”变量,因素变量温度“A”,湿度为“B”变量,重复变量“重复”。然后输入对应的数值,如图5-6 所示。或者打开已存在的数据文件“DATA5-2.SAV”。 图5-6 数据输入格式 2)启动分析过程点击主菜单“Analyze”项,在下拉菜单中点击“General Linear Model”项,在右拉式菜单中点击“Univariate”项,系统打开单因变量多因素方差分析设置窗口如图5-7。 图5-7 多因素方差分析窗口 3)设置分析变量设置因变量: 在左边变量列表中选“历期”,用向右拉按钮选入到“Depend ent Variable:”框中。 设置因素变量: 在左边变量列表中选“a”和“b”变量,用向右拉按钮移到“Fixed Factor(s):”框中。可以选择多个因素变量。由于内存容量的限制,选择的因素水平组合数(单元数)应该尽量少。 设置随机因素变量: 在左边变量列表中选“重复”变量,用向右拉按钮移到“到Random Factor(s)”框中。可以选择多个随机变量。 设置协变量:如果需要去除某个变量对因素变量的影响,可将这个变量移到“Covariate(s)”框中。 设置权重变量:如果需要分析权重变量的影响,将权重变量移到“WLS Weight”框中。 4)选择分析模型在主对话框中单击“Model”按钮,打开“Univariate Model”对话框。见图5-8。 图5-8 “Univariate Model” 定义分析模型对话框在Specify Model 栏中,指定分析模型类型。

多因素方差分析

多因素方差分析 实验目的:通过本次试验理解多因素方差分析的概念和思想,理解多个 因素存在交互效应的统计学含义和实际含义,了解方差分析分解的理论基础和计算原理,能够熟练应用单因素方差分析对具体的实际问题进行有效的分析。 实验内容:研究不同温度与不同湿度对粘虫发育历期的影响,分析不同温度和湿度对粘虫发育历期的影响是否存在着显著性差异。数据来源于网上搜索。 实验步骤: ①选择File/Open/Data命令,打开数据表。 ②选择Analyze/General Linear Model /Unievariate…命令,弹出(单变量方差分析)对话框,如图,在左侧变量框中选择“历期”变量为Dependent Vaiable (因变量)变量框,选择“温度”、“湿度”为Fixed Factors(固定因素)变量框,把重复选入Random Factors变量框。

③单击Model…按钮,弹出Univariate:Model(单变量方差分析:模型)对话框,如图所示:

弹出Univariate:Contrasts (单变量方差分析:对比)对话框: ⑤单击Continue按钮,回到方差分析对话框,单击Plots…,弹出Univariate:Plots(单变量方差分析:轮廓图)对话框:

Univariate:Post Hoc…(单变量方差分析:观察值的验后多重比较)对话框:这里不作选择

⑦单击Continue按钮,回到方差分析对话框,单击Save…,弹出Univariate:Save(单变量方差分析:保存)对话框:

⑧单击Continue按钮,回到方差分析对话框,单击Options…,弹出Univariate:Options(单变量方差分析:选项)对话框: 实验结论:

SPSS多因素方差分析

体育统计与SPSS读书笔记(八)—多因素方差分析(1) 具有两个或两个以上因素的方差分析称为多因素方差分析。 多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方差分析的 时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示,那又多了一个 时间的因素。如果每个年级都是不同的老师来上,那又多了一个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑,并确定自己只研究哪些因素。 下面用例子的形式来说说多因素方差分析的运用。还是用前面说单因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级和不同教学法班级双因素。 分析: 1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格都是有重复数据(也就是不只一个数据), 年级 不同教学方法的班级 定性班 定量班 定性定量班 五年级 (班级每个人) (班级每个人) (班级每个人) 初中二年级 (班级每个人) (班级每个人) (班级每个人) 高中二年级 (班级每个人) (班级每个人) (班级每个人) 2.因为有重复数据,所以存在在数据交互效应的可能。我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的影响不同,则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视,则常会掩盖因素的主效应的显著性,另一方面,如果对因变量Y,因素A与B之间存在交互作用,则已说明这两个因素都Y对有影响,而不管其主效应是否具有显著性。在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。在大多数场合,交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里假设他们之间有交互作用。

多因素方差分析

多因素方差分析 1.基本思想:用来研究两个及两个以上控制变量是否对观测变量产生显著影响。可以分析多个控制变量单独作用对观测变量的影响(这叫做主效应),也可以分析多个控制因素的交互作用对观测变量的影响(也称交互效应),还可以考虑其他随机变量是否对结果产生影响,进而最终找到利于观测变量的最优组合。 根据观测变量(即因变量)的数目,可以把多因素方差分析分为:单变量多因素方差分析(也叫一元多因素方差分析)与多变量多因素方差分析(即多元多因素方差分析)。 一元多因素方差分析:只有一个因变量,考察多个自变量对该因变量的影响。例如,分析不同品种、不同施肥量对农作物产量的影响时,可将农作物产量作为观测变量,品种和施肥量作为控制变量。利用多因素方差分析方法,研究不同品种、不同施肥量是如何影响农作物产量的,并进一步研究哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。 多元多因素方差分析:是对一元多因素方差分析的扩展,不仅需要检验自变量的不同水平上,因变量的均值是否存在差异,而且要检验各因变量之间的均值是否存在差异。例如,用四个班级学生分别对两种教材、两种教学方法进行试验,除了要考虑着两种教材、两种教学方法的四种搭配以外,还要考虑四个班级学生的学习能力这些因素。 2.原理:通过计算F统计量,进行F检验。F统计量是平均组间平方和与平均组内平方和的比。 这里,把总的影响平方和记为SST,它分为两个部分,一部分是由控制变量引起的离差,记为SSA(组间离差平方和),另一部分是由随机变量引起的SSE(组内离差平方和)。即SST=SSA+SSE。组间离差平方和SSA是各水平均值和总体均值离差的平方和,反映了控制变量的影响。组内离差平方和是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。 通过F值看出,如果控制变量的不同水平对观测变量有显著影响,那观测变量的组间离差平方和就大,F值也大;相反,如果控制变量的不同水平没有对观测变量造成显著影响,那组内离差平方和就比较大,F值就比较小。 同时,SPSS还会依据F分布表给出相应的相伴概率值sig。如果sig小于显著性水平(一般显著性水平设为0.05、0.01、或者0.001),则认为控制变量不同水平下各总体均值有显著差异,反之,则不然。一般地,F值越大,则sig值越小。 3.具体实现步骤: 我们现在有一个公司员工的工资表,想看一下员工性别“gender”与接受教育年限“edu”这两个控制变量对员工“当前工资”的影响。采用多因素方差分析法,则要分别考虑“gender”、“edu”对“当前工资”的影响,称为主效应,还要考虑“gender*edu”对“当前工资”的影响,称为交互效应。 ⑴将数据导入SPSS后,选择:分析->一般线性模型->单变量

多因素方差分析复习进程

多因素方差分析

多因素方差分析 1.基本思想:用来研究两个及两个以上控制变量是否对观测变量产生显著影响。可以分析多个控制变量单独作用对观测变量的影响(这叫做主效应),也可以分析多个控制因素的交互作用对观测变量的影响(也称交互效应),还可以考虑其他随机变量是否对结果产生影响,进而最终找到利于观测变量的最优组合。 根据观测变量(即因变量)的数目,可以把多因素方差分析分为:单变量多因素方差分析(也叫一元多因素方差分析)与多变量多因素方差分析(即多元多因素方差分析)。 一元多因素方差分析:只有一个因变量,考察多个自变量对该因变量的影响。例如,分析不同品种、不同施肥量对农作物产量的影响时,可将农作物产量作为观测变量,品种和施肥量作为控制变量。利用多因素方差分析方法,研究不同品种、不同施肥量是如何影响农作物产量的,并进一步研究哪种品种与哪种水平的施肥量是提高农作物产量的最优组合。 多元多因素方差分析:是对一元多因素方差分析的扩展,不仅需要检验自变量的不同水平上,因变量的均值是否存在差异,而且要检验各因变量之间的均值是否存在差异。例如,用四个班级学生分别对两种教材、两种教学方法进行试验,除了要考虑着两种教材、两种教学方法的四种搭配以外,还要考虑四个班级学生的学习能力这些因素。 2.原理:通过计算F统计量,进行F检验。F统计量是平均组间平方和与平均组内平方和的比。 这里,把总的影响平方和记为SST,它分为两个部分,一部分是由控制变量引起的离差,记为SSA(组间离差平方和),另一部分是由随机变量引起的SSE(组内离差平方和)。即SST=SSA+SSE。组间离差平方和SSA是各水平均值和总体均值离差的平方和,反映了控制变量的影响。组内离差平方和是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。 通过F值看出,如果控制变量的不同水平对观测变量有显著影响,那观测变量的组间离差平方和就大,F值也大;相反,如果控制变量的不同水平没有对观测变量造成显著影响,那组内离差平方和就比较大,F值就比较小。 同时,SPSS还会依据F分布表给出相应的相伴概率值sig。如果sig小于显著性水平(一般显著性水平设为0.05、0.01、或者0.001),则认为控制变量不同水平下各总体均值有显著差异,反之,则不然。一般地,F值越大,则sig值越小。 3.具体实现步骤: 我们现在有一个公司员工的工资表,想看一下员工性别“gender”与接受教育年限“edu”这两个控制变量对员工“当前工资”的影响。采用多因素方差分析法,则要分别考虑“gender”、“edu”对“当前工资”的影响,称为主效应,还要考虑“gender*edu”对“当前工资”的影响,称为交互效应。 ⑴将数据导入SPSS后,选择:分析->一般线性模型->单变量

第8讲单因素方差分析与多重比较

方差分析 方差分析(analysis of variance ), 简称ANOV A,由英国统计学家,后人为纪念Fisher ,以F命名方差分析的统计量,故方差分析又称F 检验。 样本均数的差异,可能有两种原因所致。首先可能由随机误差所致随机误差包括两种成分:个体间的变异和测量误差两部分;其次可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组之间均数不同。一般来说,个体之间各不相同,是繁杂的生物界的特点;测量误差也是不可避免的,因此第一种原因肯定存在。而第二种原因是否存在,这正是假设检验要回答的问题。 方差分析的基本思想是将所有观察值之间的变异(称总变异)按设计和需要分解成几部分。如完全随机设计资料的方差分析,将总变异分解为处理间变异和组内变异两部分,后者常称为误差。将各部分变异除以误差部分,得到统计量F值,并根据F值确定P值作推断。 由于方差分析是根据实验设计将总变异分成若干部分,因此设计时考虑的因素越多,变异划分的越精细,各部分变异的涵义越清晰明确,结论的解释也越容易,同时由于变异划分的精细,误差部分减小,提高了检验的灵敏度和结论的准确性。 方差分析可用于: (1)两个或多个样本均数间的比较 (2)分析两个或多个因素的交互作用 1

(3)回归方程的假设检验 (4)方差齐性检验 多个样本均数间比较的方差分析应用条件为: (1)各样本必须是相互独立的随机样本(独立性) (2)各样本均来自正态总体(正态性) (3)相互比较的各样本的总体方差相等(方差齐性) 一、完全随机设计的方差分析 医学实验中,根据某一实验因素,用随机的方法,将受试对象分配到各组,各组分别接受不同的处理后,观察各种处理的效果,比较各组均数之间有无差别。临床研究中,还可能遇到:比较几种不同疗法治疗某种疾病后某指标的变化,以评价它们的疗效;或比较某种疾病不同类型之间某一指标有无差别等。这些都是一个因素不同水平(或状态)间几个样本均数的比较,可用单因素的方差分析(one-way ANOV A)来处理此类资料。

SPSS多因素方差分析

莇蒂蒂薆袈肀蚄体育统计与SPSS读书笔记(八)—多因素方差分析(1) 虿薅肆螆薁蒃莆具有两个或两个以上因素的方差分析称为多因素方差分析。 蒃薇衿肁莂螇蒀多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方 差分析的时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因 素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成 了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示, 那又多了一个时间的因素。如果每个年级都是不同的老师来上,那又多了一 个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑, 并确定自己只研究哪些因素。 螄螈蒂蒅肃芈膀下面用例子的形式来说说多因素方差分析的运用。还是用前面说单 因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级 和不同教学法班级双因素。 薇蝿莃蒄膇蚀节分析: 芀膂羅羆肁莅芅1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格 都是有重复数据(也就是不只一个数据), 肁蒆腿薂芄螅虿年级 羆羇蝿肂芆薈蚀不同教学方法的班级 袆艿羁螇莇膁膄定性班 螀肄羄薀蚂肂蒇定量班 羃蒄莈衿袁蚄罿定性定量班 羅芇荿羄膅螈芁五年级 莀袀袃蚅蚆螂螁(班级每个人) 莁蚁膆蝿羈袄莆(班级每个人) 袄蚇蚈葿螃袇腿(班级每个人) 袄蒇羀蚁莇肇袂初中二年级 蕿蒁螄薄羆肈蚃(班级每个人) 羁薃肅聿蕿薂莄(班级每个人) 蒂薆袈肀蚄袅蒈(班级每个人) 肆螆薁蒃莆莇蒂高中二年级 衿肁莂螇蒀虿薅(班级每个人) 蒂蒅肃芈膀蒃薇(班级每个人) 莃蒄膇蚀节螄螈(班级每个人) 羅羆肁莅芅薇蝿 2.因为有重复数据,所以存在在数据交互效应的可能。我们来看看交效应的含义:如果在A因素的不同水平上,B因素对因变量的 影响不同,则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视,则常会掩盖因 素的主效应的显著性,另一方面,如果对因变量Y,因素A与B之间存在交互作用,则已说明这两个因素都Y对有影响,而不管其主效应是否具有显著性。在统计模型中考虑交互作用,是系统论思想在统计方法中的反映。在大多数 场合,交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上 面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里 假设他们之间有交互作用。

spss相关分析案例多因素方差分析

本次实验采用2005年东部、中部和西部各地区省份城镇居民月平均消费类型划分的数据(课本139页),将东部、中部和西部看作三个不同总体,31个数据分别来自于这三个总体。本人对这三个不同地区的城镇居民月平均消费水平进行比较,并选取人均粮食支出、副食支出、烟酒及饮料支出、其他副食支出、衣着支出、日用杂品支出、水电燃料支出和其他非商品支出八个指标来衡量城镇居民月平均消费情况。 在进行比较分析之前,首先对个数据是否服从多元正态分布进行检验,输出结果为: 表一 如表一,因为该例中样本数n=31<2000,所以此处选用Shapiro-Wilk统计量。由正态性检验结果的sig.值可以看到,人均粮食支出、烟酒及饮料支出、其他副食支出、水电燃料支出和其他非商品支出均明显不遵从正态分布(Sig.值小于,拒绝服从正态分布的原假设),因此,在下面分析中,只对人均副食支出、衣着支出和日用杂品支出三项指标进行比较,并认为这三个变量组成的向量都遵从正态分

布,并对城镇居民月平均消费状况做出近似的度量。另外,正态性的检验还可以通过Q-Q图来实现,此时应判别数据点是否与已知直线拟合得好。如果数据点均落在直线附近,说明拟合得好,服从正态分布,反之,不服从。具体情况这里不再赘述。 下面进行多因素方差分析: 一、多变量检验 表二 由地区一栏的(即第二栏)所列几个统计量的Sig.值可以看到,无论从那个统计量来看,三个地区的城镇居民月平均消费水平都是有显著差别的(Sig.值小于,拒绝地区取值不同,对Y,即城镇居民月平均消费水平的取值没有显著影响的原假设)。 二、主体间效应检验 表三

如表三,可以看到三个指标地区一栏的(即第三栏)Sig.值分别为、、,说明三个地区在人均衣着支出指标上没有明显的差别(Sig.值大于,不拒绝地区取值不同,对指标的取值没有显著影响的原假设),反之,而在人均副食支出和日用杂品支出指标上有显著差别。 三、多重比较 表四 Contrast Results (K Matrix) 地区Simple Contrast a Dependent Variable 人均副食支出(元/人) 人均日用杂品支出(元 /人)人均衣着支出(元/人) Level 1 vs. Level 3Contrast Estimate Hypothesized Value000 Difference (Estimate - Hypothesized) Std. Error Sig..001.036.517 95% Confidence Interval for Difference Lower Bound .173 Upper Bound Level 2 vs. Level 3Contrast Estimate Hypothesized Value000 Difference (Estimate - Hypothesized) Std. Error Sig..668.343.638 95% Confidence Interval for Difference Lower Bound Upper Bound

相关文档