文档视界 最新最全的文档下载
当前位置:文档视界 › 完整word版,SPSS聚类分析实验报告.docx

完整word版,SPSS聚类分析实验报告.docx

完整word版,SPSS聚类分析实验报告.docx
完整word版,SPSS聚类分析实验报告.docx

SPSS 聚类分析实验报告

一.实验目的:

1、理解聚类分析的相关理论与应用

2、熟悉运用聚类分析对经济、社会问题进行分析、

3、熟练 SPSS软件相关操作

4、熟悉实验报告的书写

二.实验要求:

1、生成新变量总消费支出=各变量之和

2、对变量食品支出和居住支出进行配对样本T 检验,并说明检验结果

3、对各省的总消费支出做出条形图(用EXCEL做图也行)

4、利用 K-Mean法把 31 省分成 3 类

5、对聚类分析结果进行解释说明

6、完成实验报告

三.实验方法与步骤

准备工作:把实验所用数据从 Word文档复制到 Excel ,并进一步导入到 SPSS数据文件中。

分析:由于本实验中要对 31 个个案进行分类,数量比较大,用系统聚类法当然也

可以得出结果,但是相比之下在数据量较大时, K 均值聚类法更快速高效,而且准确性更高。

四、实验结果与数据处理:

1.用系统聚类法对所有个案进行聚类:

生成新变量总消费支出 =各变量之和如图所示:

2.对变量食品支出和居住支出进行配对样本 T 检验,如图所示:

得出结论:

3.对各省的总消费支出做出条形图,如图所示:

4.对聚类分析结果进行解释说明:

K均值分析将这样的城市分为三类:

第一类北京、上海、广东

第二类除第一类第三类以外的

第三类天津、福建、内蒙古、辽宁、山东

第一类经济发展水平高,各项支出占总支出比重高,人民生活水平高。第二类城市位于中西部地区,经济落后,人民消费水平低。第三类城市位于中东部地区,经济发展较好。

初始聚类中心

聚类

123

食品支出7776.983052.575790.72衣着支出1794.061205.891281.25居住支出2166.221245.001606.27家庭设备及服务支出1800.19612.59972.24医疗保健支出1005.54774.89617.36交通和通信支出4076.461340.902196.88文化与娱乐服务支出3363.251229.681786.00其它商品和服务支出1217.70331.14499.30总消费支出23200.409792.6614750.02

迭代历史记录a

聚类中心内的更改

迭代123

11250.5921698.8651216.114

2416.86470.786173.731

3138.955 2.94924.819

446.318.123 3.546

5849.114319.1791362.411

6805.00415.199606.915

7161.001.72475.864

832.200.0349.483

9 6.440.002 1.185

10 1.2887.815E-5.148

迭代历史记录a

聚类中心内的更改

迭代123 11250.5921698.8651216.114 2416.86470.786173.731 3138.955 2.94924.819 446.318.123 3.546 5849.114319.1791362.411 6805.00415.199606.915 7161.001.72475.864 832.200.0349.483

9 6.440.002 1.185

10 1.2887.815E-5.148

a.迭代已停止,因为完成了最大次数的迭代。迭

代无法收敛。任何中心的最大绝对坐标更改为

1.193 。当前迭代为10 。初始中心间的最小距离为578

2.189 。

聚类成员

案例号地区聚类距离

1北京1640.096 2浙江12214.882 3天津32632.528 4福建31136.449 5广东11566.989 6河北2979.543 7山西21491.089 8吉林21075.390 9黑龙江2599.152 10河南2598.222 11甘肃21100.435 12青海21340.603 13宁夏2667.823 14新疆2850.725 15内蒙古31033.683 16辽宁31046.739 17山东31402.822 18西藏21676.670 19广西2989.535 20海南21131.085

21四川21481.307

22云南2927.830

23安徽2811.211

24江西2420.381

25湖北2777.322

26湖南21073.337

27重庆31086.871

28贵州2876.796

29陕西21161.344

30上海13635.950

31江苏3616.506

最终聚类中心

聚类

123

食品支出6758.744083.345008.89

衣着支出1728.751257.761649.65

居住支出1771.691087.121405.68

家庭设备及服务支出1325.54703.17977.20

医疗保健支出1073.99751.25973.12

交通和通信支出3588.561412.741950.42

文化与娱乐服务支出2806.811155.731680.80

其它商品和服务支出816.58394.99553.85

总消费支出19870.6610846.1114199.60

最终聚类中心间的距离

聚类123

19870.1636286.100

29870.1633615.509

36286.1003615.509

ANOVA

聚类误差

均方df均方df F Sig.

食品支出12552971.1922339637.5842836.960.000衣着支出635822.817266083.731289.621.001居住支出894351.288236596.0972824.438.000家庭设备及服务支出724161.235229902.4112824.217.000医疗保健支出250143.461236490.47428 6.855.004

==========================================================

交通和通信支出7973401.675288439.5362890.157.000文化与娱乐服务支出4712619.943273922.6272863.751.000其它商品和服务支出317485.863215486.5222820.501.000总消费支出 1.450E821348215.43728107.553.000 F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。

每个聚类中的案例数

聚类1 4.000

220.000

37.000

有效31.000

缺失.000

实验结果分析:

第一类城市经济发展最好,第二类城市经济最落后。国家应加大对于第二类城市经济发展的扶

持力度,努力缩小经济发展差距,实现地区的公平。

相关文档