聚类分析的案例分析.doc

上传人:一*** 文档编号:578573 上传时间:2018-11-01 格式:DOC 页数:10 大小:253.44KB
返回 下载 相关 举报
聚类分析的案例分析.doc_第1页
第1页 / 共10页
聚类分析的案例分析.doc_第2页
第2页 / 共10页
点击查看更多>>
资源描述

《聚类分析的案例分析.doc》由会员分享,可在线阅读,更多相关《聚类分析的案例分析.doc(10页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、|应用多元统计分析报告班级:学号:姓名:|聚类分析的案例分析摘要本文主要用 SPSS 软件对实验数据运用系统聚类法和 K 均值聚类法进行聚类分析,从而实现聚类分析及其运用。利用聚类分析研究某化工厂周围的几个地区的气体浓度的情况,从而判断出这几个地区的污染程度。经过聚类分析可以得到,样本 6 这一地区的气体浓度值最高,污染程度是最严重的,样本 3 和样本 4 气体浓度较高,污染程度也比较严重,因此要给予及时的控制和改善。关键词:SPSS 软件 聚类分析 学生成绩|1、数学模型聚类分析的基本思想是认为各个样本与所选择的指标之间存在着不同程度的相似性。可以根据这些相似性把相似程度较高的归为一类,从而

2、对其总体进行分析和总结,判断其之间的差距。系统聚类法的基本思想是在这几个样本之间定义其之间的距离,在多个变量之间定义其相似系数,距离或者相似系数代表着样本或者变量之间的相似程度。根据相似程度的不同大小,将样本进行归类,将关系较为密切的归为一类,关系较为疏远的后归为一类,用不同的方法将所有的样本都聚到合适的类中,这里我们用的是最近距离法,形成一个聚类树形图,可据此清楚的看出样本的分类情况。K 均值法是将每个样品分配给最近中心的类中,只产生指定类数的聚类结果。2、数据来源应用多元统计分析第一版 164 页第 6 题我国山区有一某大型化工厂,在该厂区的邻近地区中挑选其中最具有代表性的 8 个大气取样

3、点,在固定的时间点每日 4 次抽取 6 种大气样本,测定其中包含的 8 个取样点中每种气体的平均浓度,数据如下表。试用聚类分析方法对取样点及大气污染气体进行分类。|3、建立数学模型1、运行过程(一)系统聚类分析在 SPSS 界面对上述数据进行系统聚类分析如图 1 和图 2 所示,进行最近距离分类。图 1图 2|(二)K 均值聚类分析对数据进行 K 均值聚类分析,如下图所示:图 3图 4图 5|2、运行结果(1)聚类树形图图 6由图可以看出,将数据进行聚类分析,根据设定的分为了二类到三类。若分为两类则样本 6 为一类,其他为一类;若分为三类则将样本四分离出来,其他分为一类。(2)新变量图 7该图

4、显示将分类结果的新变量,分别为 CLU3_1 和 CLU2_1。可以清楚的看到将数据聚为 2 类和 3 类的分类情况。|(3)新变量迭代过程中类中心的变化量迭代历史记录 a聚类中心内的更改迭代 1 2 3 41 .049 .042 .000 .0742 .000 .000 .000 .000a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 2。初始中心间的最小距离为 .230。图 8从表中可以看出本次聚类过程共进行了两次迭代。由于我们在 Iterate 子对话框中设置最大迭代次数为 10 和收敛判据为 0,所以在第二次迭代后,类中心的变化为

5、0,从而迭代停止。(4)各观测量所属类成员表聚类成员案例号 聚类 距离1 1 .0492 1 .0713 4 .0744 4 .0745 2 .0426 3 .0007 2 .0428 1 .060图 9(5)最终类中心表|最终聚类中心聚类1 2 3 4X1 .0580 .0660 .0640 .0360X2 .0753 .0775 .0720 .1125X3 .0527 .0455 .1000 .0685X4 .0660 .2900 .2100 .1650X5 .0397 .0250 .0280 .1290X6 .0168 .0385 1.3800 .0360图 10根据结果(五)和结果(六

6、)可以看出,将8个样本聚为了4类。第一类包括样本1、样本2和样本8,根据图1中聚类1这一列可以看出,这一类为这四类中气体浓度值最低的一类,也就是说该类的环境污染不严重,属于优;第二类包括样本5和样本7,该类气体浓度也是比较低的一类,环境污染有些严重,属于良;第三类包括样本6,这一气体浓度最高,环境污染最严重,属于差;第四类包括样本3和样本4,环境污染较严重,属于中。(6)新变量如图所示,QCL_1 为分类情况,而 QCL_2 为所属类中心距离。4、结论通过在 SPSS 软件中对聚类分析案例的运用将不同的样本聚为不同的类,并算出其间的距离更加清楚方便的将多项不同的样本进行聚类分析,并对其的总|体情况进行估计,最后能够得到各类别的气体浓度总体情况,从而判断出环境污染的严重情况。经过这次实验学到了很多东西,遇到的问题也一一得到解决。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com