一、聚类分析的基本思想:
我们认为,所研究的样品或指标之间存在着程度不同的相似性。根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间的相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品聚合为一类,把另一些彼此之间
相似程度较大的样品又聚合到另外一类。把不同的类型划分
出来,形成一个由小到大的分类系统。最后,用分群图把所有的样品间的亲疏关系表示出来。
二、聚类分析的方法
系统聚类法、模糊聚类法、均值法、有序样品的聚类、分解
法、加入法
三、系统聚类法的种类
最短距离法、最长距离法、重心法、类平均法、离差平方和
法
四、判别分析的基本思想
判别分析用来解决被解释变量是非度量变量的情形,预测和解释
影响一个对象所属类别。识别一个个体所属类别的情况下有着广泛的应用判别分析将对象进行分析,通过人们选择的解释变量来预测或者解释每个对象的所属类别。
五、判别分析的假设条件
判别分析的假设条件之一是每一个判别变量不能是其他判别变量的线性组合;判别分析的假设之二是各组变量的协方差矩阵相等。判别分析最简单和最常用的形式是采用线性判别函数。判别
分析的假设之三是各判别变量之间具有多元正态分布,即每个变
量对于所有其他变量的固定值有正态分布。当违背该假设时,计
算的概率将非常的不准确。
六、判别分析的方法
距离判别法、判别法、判别法、逐步判别法
七、距离判别法的判别准则
设有两个总体G和G2,X是一个p维样品,若能定义样品到总体G和G2的距离d(x,G i)和d(x,G2),则用如下规则进行判别:若样品X到总体G的距离小于到总体G2的距离,则认为样品X属于总体G i,反之,则认为样品X属于总体样品X属于总体G2,若样品X到总体G和G2的距离相等,则让它待判。
八、判别的思想
判别的思想是投影,将k组p维数据投影到某一个方向,使的它们的投影与组之间尽可能地分开。
九、判别的思想
统计的思想是:假定对研究的对象已有一定的认识,常用先
验概率分布来描述这种认识,然后我们取得一个样本,用样本来修正已有的认识,得到后验概率分布,各种统计推断都通过后验概率分布来进行。将统计的思想用于判别分析,就得到判别。
十、判别分析的方法和步骤
1.判别分析的对象
2.判别分析的研究设计
3.判别分析的假
定
4.估计判别模型和评估整体拟合
5.结果的解释
6.结果的验证
十一、提取主成分的原则
1.累计方差贡献率大于85%
2.特征根大于1 ,3碎石图特征根的变化趋势。
十二、因子分析的步骤
1. 根据研究问题选取原始变量。
2.对原始变量进行标准化并求其相关阵,分析变量之间的相关性。
3.求解初始公共因子及因子载荷矩阵。
4.因子旋转。
5.因子得分。
6.根据因子得分值进行进一步分析。
十三、主成分分析与因子分析的区别。
1. 因子分析把展示在我们面前的诸多变量看成由对每一个变量都有作用的一些公共因子和一些仅对某一个变量有作用的特殊因子线性组合而成;主成分分析则简单一些,它只是从空间生成的角度寻找能解释诸多变量变
异绝大部分的几组彼此不相关的新变量。
2.因子分析中是把变量表示成各因子的线性组合,而主成分分析则是把主成分表示成各变量的线性组合。
3.主成分分析中不需要假设,因子分析则需要一些假设。
4.抽取主因子的方法不仅有主成分法,还有极大似然法等,而主成分只能用主成分提取法。
5.主成分分析中,当协方差矩阵或相关阵的特征值唯一时,主成分是固定的;因子分析中因子不是固定的。
6.在因子分析中,因子个数需要分析者指定;在主成分分析中,成分的数量是一定的。
7.和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。
十四、因子载荷的统计含义
1. 因子载荷a j的统计含义:
由模型
m
cov(X j, FJ 二cov「 a F j ;i, F j)
j总
m
= cov(\ a j F j, F j) cov( ^,F j)
j #
a ij
即a j是X i与F j的协方差,而注意到,X i与F j (1,2,3,…,p; 1,2…
m都是均值为0,方差为1的变量,因此,a j同时也是X i与F j的相关系数。
十五、求解因子载荷有哪些方法
如主成分法,主轴因子法,最小二乘法,极大似然法,因子提取法;常用的主要是主成分法,主轴因子法与极大似然法