统计软件实习课程.ppt

上传人:hyn****60 文档编号:70709034 上传时间:2023-01-25 格式:PPT 页数:51 大小:549.50KB
返回 下载 相关 举报
统计软件实习课程.ppt_第1页
第1页 / 共51页
统计软件实习课程.ppt_第2页
第2页 / 共51页
点击查看更多>>
资源描述

《统计软件实习课程.ppt》由会员分享,可在线阅读,更多相关《统计软件实习课程.ppt(51页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、LOGO统计软件应用实习统计软件应用实习Contents实验一实验一 聚类分析聚类分析1实验二实验二 因子分析因子分析2实验三实验三 线性回归分析线性回归分析3实验四实验四 非线性回归分析非线性回归分析 4Company Logo实习课基本要求实习课基本要求v实习内容与要求实习内容与要求根据所学统计学基础课程,结合SPSS统计软件,选择统计建模题目,并可与经济学方面内容进行很好的融合。写出不少于3000字的实习报告,报告中除了封面应有题目、班级、姓名、学号和撰写日期外,正文还应该包括:Company Logo实习课基本要求实习课基本要求 问题背景 数据来源和数据整理 数据变量说明 统计模型说明

2、 结果解释或应用分析 心得体会 附录或参考资料Company Logo实习课基本要求实习课基本要求v数据资料来源:数据资料来源:河南统计年鉴河南统计年鉴 中国统计年鉴中国统计年鉴 中国科技统计年鉴中国科技统计年鉴 部分国际统计年鉴部分国际统计年鉴 可参考研究问题的相关官方网站下载数据可参考研究问题的相关官方网站下载数据Company Logo实习课基本要求实习课基本要求v参考题目:参考题目:我国各省区财政状况对经济增长的作用分析我国各省区财政状况对经济增长的作用分析 人口分布变动的影响因素模型分析人口分布变动的影响因素模型分析 我国二元结构的统计分析我国二元结构的统计分析 物流业在我省经济发展

3、中的作用和影响统计分析物流业在我省经济发展中的作用和影响统计分析 外贸对我省经济发展作用的统计分析外贸对我省经济发展作用的统计分析Company Logo实习课基本要求实习课基本要求v考核方式考核方式 根据完成实习任务的情况、实习报告、实习过程根据完成实习任务的情况、实习报告、实习过程中的课程等综合打分。中的课程等综合打分。上课情况上课情况 20%(包括出勤情况,调试表现)(包括出勤情况,调试表现)实习报告实习报告 30%+50%(实习报告撰写过程中(实习报告撰写过程中态度态度+实习报告最终成果)实习报告最终成果)成绩评定为优、良、中、及格和不及格五个等成绩评定为优、良、中、及格和不及格五个等

4、级。不及格的要求重做,不给予学分。级。不及格的要求重做,不给予学分。Company Logo实验一实验一 聚类分析聚类分析v聚类分析聚类分析 是探索性分析的一种。是探索性分析的一种。能够将样本数据按照他们在性质上的亲疏程能够将样本数据按照他们在性质上的亲疏程度在没有先验知识的情况下自动分类。度在没有先验知识的情况下自动分类。聚类分析所采用的聚类方法不同,得出的结聚类分析所采用的聚类方法不同,得出的结论也会有所差异。因此不同的研究者对同一组数据论也会有所差异。因此不同的研究者对同一组数据进行聚类分析时,所得的聚类数未必一致。进行聚类分析时,所得的聚类数未必一致。Company Logo实验一实验

5、一 聚类分析聚类分析快速聚类方法快速聚类方法(k-means cluster analyze)适用于观测数在200以上聚类方法聚类方法层次聚类分析法层次聚类分析法(Hierarchical cluster analyze)可分为:Q型聚类:对样本分类R型聚类:对变量分类Company Logo实验一实验一 聚类分析聚类分析样本间样本间亲疏程度亲疏程度样本间距离计算,作为合并基础欧氏距离欧氏距离欧氏距离平方欧氏距离平方Chebychev距离距离Block距离距离Minkowski距离距离用户自定义距离用户自定义距离Company Logo实验一实验一 聚类分析聚类分析样本与小类样本与小类小类与小

6、类小类与小类样本合并成小类,小类合并成更大类的方法最短距离法最短距离法最长距离法最长距离法类间平均链锁法类间平均链锁法类内平均链锁法类内平均链锁法重心法重心法离差平方和法离差平方和法Company Logo实验一实验一 聚类分析聚类分析v案例:案例:河南省工业企业发展状况的区域比较研究河南省工业企业发展状况的区域比较研究数据来源:数据来源:2010河南统计年鉴河南统计年鉴分析步骤:分析步骤:第一步:分析经济原理第一步:分析经济原理 第二步:整理数据,形成分析数据文件第二步:整理数据,形成分析数据文件 第三步:导入数据,进行分析(第三步:导入数据,进行分析(Q型聚类)型聚类)第四步:结果解释第四

7、步:结果解释Company Logo试验一试验一 聚类分析聚类分析主营业务成本利润总额主营业务成本资产总计负债总计规模以上工业企业个数规模以上工业企业增加值从业人员年平均人数成本费用利润率资产负债率产品销售率全员劳动生产率企业规模生产经营经济效益Company Logo实验一实验一 聚类分析聚类分析v部分指标解释部分指标解释 Company Logo实验一实验一 聚类分析聚类分析vR型聚类:对研究对象的观察变量进行分类型聚类:对研究对象的观察变量进行分类 数据来源:河南省工业企业的年鉴数据数据来源:河南省工业企业的年鉴数据 对所选用变量进行分类对所选用变量进行分类 步骤:步骤:第一步:导入数据

8、第一步:导入数据 第二步:进行第二步:进行R型聚类型聚类 第三步:观察结果是否合理,与我们之前所做分第三步:观察结果是否合理,与我们之前所做分类是否吻合。类是否吻合。Company Logo实验二实验二 因子分析因子分析v因子分析是数据降维处理方法的一种,其目的是以因子分析是数据降维处理方法的一种,其目的是以较少的几个因子反应原资料的大部分信息。较少的几个因子反应原资料的大部分信息。v一、特点:一、特点:因子变量的数量少于原有的指标变量的数量,因子变量的数量少于原有的指标变量的数量,能有减少分析中的工作量。能有减少分析中的工作量。因子变量不是对原有变量的取舍,而是根据原因子变量不是对原有变量的

9、取舍,而是根据原始变量的信息进行重组。始变量的信息进行重组。因子变量之间不存在线性关系,分析方便。因子变量之间不存在线性关系,分析方便。因子变量具有命名解释性,即因子是对某些原因子变量具有命名解释性,即因子是对某些原始变量信息的综合和反应。始变量信息的综合和反应。Company Logo实验二实验二 因子分析因子分析v二、数学模型二、数学模型Company Logo实验二实验二 因子分析因子分析v三、因子分析的步骤三、因子分析的步骤 1、确定待分析的原有若干变量是否适合做因子、确定待分析的原有若干变量是否适合做因子分析;分析;2、构造因子变量;、构造因子变量;3、利用旋转是的因子变量更具有可解

10、释性;、利用旋转是的因子变量更具有可解释性;4、计算因子变量的得分。、计算因子变量的得分。Company Logo是否适合做因子分析的检验是否适合做因子分析的检验1巴特利特球形检验巴特利特球形检验 伴随概率小于显著性水平,拒绝原假设,即原始变量之间存在相关性,适合做因子分析。2KMO检验检验0.9以上 非常适合0.80.9 适合0.70.8 一般0.60.7不太适合0.5以下 不适合3反映像相关矩阵检反映像相关矩阵检验验 矩阵中某些元素的绝对值比较大,则说明这些变量不适于做因子分析Company Logo实验二实验二 因子分析因子分析v构造因子变量构造因子变量 主成分分析法,将原有相关变量主成

11、分分析法,将原有相关变量x线性变换成线性变换成另一组不相关的变量另一组不相关的变量y。主成分个数。主成分个数m的确定方式:的确定方式:根据特征值的大小,特征值大于根据特征值的大小,特征值大于1;根据因子的累;根据因子的累积方差贡献率,大于积方差贡献率,大于80%。v因子变量的命名解释因子变量的命名解释 通过因子矩阵的旋转,是因子载荷矩阵的数通过因子矩阵的旋转,是因子载荷矩阵的数值差异较大,更容易判断每个因子的解释力。值差异较大,更容易判断每个因子的解释力。v计算因子得分计算因子得分 回归法,回归法,Bartlette法等法等Company Logo实验二实验二 因子分析因子分析v案例分析案例分

12、析 河南省工业企业发展的区域比较研究河南省工业企业发展的区域比较研究 数据:与聚类分析相同,共有数据:与聚类分析相同,共有12个指标个指标 聚类分析时,聚类分析时,R型聚类只是把所有变量进行了型聚类只是把所有变量进行了分类,但是指标数量仍然较多,不利于进行深入分分类,但是指标数量仍然较多,不利于进行深入分析。析。因此要对变量进行降维处理,也即是因子分因此要对变量进行降维处理,也即是因子分析。用少量的因子对各区域的工业发展水平进行分析。用少量的因子对各区域的工业发展水平进行分析和研究。析和研究。Company Logo实验二实验二 因子分析因子分析v因子提取结果:因子提取结果:第第1个因子:主营

13、业务收入;主营业务成本;个因子:主营业务收入;主营业务成本;规模以上工业企业增加值;企业个数;从业人员;规模以上工业企业增加值;企业个数;从业人员;利润总额;资产总计;负债总计。利润总额;资产总计;负债总计。第第2个因子:资产负债率;成本费用利润率。个因子:资产负债率;成本费用利润率。第第3个因子:全员劳动生产率;产品销售率。个因子:全员劳动生产率;产品销售率。每个市的工业企业综合发展能力:每个市的工业企业综合发展能力:综合判断综合判断=a1F1+a2F2+a3F3 权重可由专家判断。权重可由专家判断。Company Logo实验三实验三 线性回归分析线性回归分析v变量之间关系:变量之间关系:

14、函数关系:一一对应的确定性关系。函数关系:一一对应的确定性关系。统计关系:变量之间关系不能由函数表达式来统计关系:变量之间关系不能由函数表达式来反应。反应。相关关系:反映变量之间线性相关程度。相关关系:反映变量之间线性相关程度。回归关系:用数学表达式描述变量间关系。回归关系:用数学表达式描述变量间关系。v相关关系分析:相关关系分析:样本相关系数样本相关系数总体相关系数总体相关系数 Company Logo实验三实验三 线性回归分析线性回归分析v相关系数判定标准相关系数判定标准Company Logo实验三实验三 线性回归分析线性回归分析v两总体线性相关系数假设检验:两总体线性相关系数假设检验:

15、H0:总体相关性为零(两总体无显著线性相关关系):总体相关性为零(两总体无显著线性相关关系)计算相应得统计量计算相应得统计量 (一)定距变量:(一)定距变量:Pearson简单相关系数简单相关系数 Company Logo实验三实验三 线性回归分析线性回归分析(二)定序变量:(二)定序变量:spearman等级相关系数等级相关系数 Ui,Vi是两变量排序后的秩是两变量排序后的秩Company Logo实验三实验三 线性回归分析线性回归分析v回归分析:回归分析:通过一定的数学表达式来描述变量之通过一定的数学表达式来描述变量之间的关系,进而确定一个或几个变量的变化对另间的关系,进而确定一个或几个变

16、量的变化对另一个特征变量的影响程度。一个特征变量的影响程度。Company Logo实验三实验三 线性回归分析线性回归分析第四步第四步第三步第三步第二步第二步第一步第一步统计检验统计检验代入数据,估计参数代入数据,估计参数建立直线回归方程建立直线回归方程确定变量之间线性关系确定变量之间线性关系Company Logo实验三实验三 线性回归分析线性回归分析v第一步:线性相关关系分析(散点图,相关程度第一步:线性相关关系分析(散点图,相关程度检验)检验)v第二步:建立直线回归方程第二步:建立直线回归方程v第三步:估计参数(第三步:估计参数(OLS普通最小二乘法)普通最小二乘法)Company Lo

17、go实验三实验三 线性回归分析线性回归分析v第四步:统计检验第四步:统计检验(1)拟合优度检验()拟合优度检验(R2)检验样本回归直线对样本数据的代表性高低检验样本回归直线对样本数据的代表性高低Company Logo实验三实验三 线性回归分析线性回归分析(2)回归方程的显著性检验()回归方程的显著性检验(F检验)检验)Company Logo实验三实验三 线性回归分析线性回归分析(3)回归系数的显著性检验()回归系数的显著性检验(t检验)检验)Company Logo实验三实验三 线性回归分析线性回归分析v案例分析案例分析 河南省工业企业发展水平影响因素分析河南省工业企业发展水平影响因素分析

18、 一、工业企业发展水平衡量指标(一、工业企业发展水平衡量指标(Y)规模以上工业企业增加值规模以上工业企业增加值 二、影响因素(二、影响因素(X)内外部影响因素指标体系内外部影响因素指标体系Company Logo实验三实验三 线性回归分析线性回归分析企业发展影响因素体系企业发展影响因素体系内部影响因素企业规模企业规模企业规模企业规模科技水平科技水平科技水平科技水平经营总量经营总量经营总量经营总量经营效益经营效益经营效益经营效益Company Logo实验三实验三 线性回归分析线性回归分析企业发展影响因素体系企业发展影响因素体系外部支撑和环境基础设施基础设施基础设施基础设施区域经济区域经济区域经

19、济区域经济总量总量总量总量金融服务金融服务金融服务金融服务Company Logo实验步骤实验步骤第二步Add Your Title第一步 判断各自变量与因变量之间线性关系是否显著 对变量做描述统计分析,了解它们的基本统计特征。建立回归模型,估计参数,并进行检验和结果分析。Company Logo实验四实验四 非线性回归分析非线性回归分析v 非线性回归分析非线性回归分析Logistic回归分析回归分析 Logistic回归为概率型非线性回归模型,是回归为概率型非线性回归模型,是研究分类观察结果研究分类观察结果Y与影响因素与影响因素X之间关系得一种之间关系得一种多变量分析方法。用来回答某现象发生

20、与否与哪些多变量分析方法。用来回答某现象发生与否与哪些因素有关。因素有关。用一组观察数据拟合用一组观察数据拟合Logistic模型,揭示若模型,揭示若干干X与一个因变量取值的关系。与一个因变量取值的关系。Y的取值有两分类和多分类。重点分析两分类,的取值有两分类和多分类。重点分析两分类,即即Y=0或或Y=1.Company Logo实验四实验四 非线性回归分析非线性回归分析v记记 为某因素下,结果为某因素下,结果Y=1得概率模型得概率模型 Logistic函数函数 Logistic回归函数回归函数 非线形概率模型非线形概率模型Company Logo实验四实验四 非线性回归分析非线性回归分析vL

21、ogistic回归模型方程的线性变换回归模型方程的线性变换 Logit变换变换Company Logo实验四实验四 非线性回归分析非线性回归分析vLogit(p)与)与x呈现线性关系。呈现线性关系。v当当X取多个值得时候,该线性变换同样有效。取多个值得时候,该线性变换同样有效。v模型中参数的意义模型中参数的意义 Company Logo实验四实验四 非线性回归分析非线性回归分析v参数估计参数估计 极大似然估计(极大似然估计(ML)非线性迭代方法非线性迭代方法Newton-Raphson法法v参数检验:参数检验:-2LL对数似然比检验对数似然比检验 在在Logistic回归分析中,不能再用线性回

22、归估计分回归分析中,不能再用线性回归估计分析中的析中的F值作为检验标准,而应采用固有方法。值作为检验标准,而应采用固有方法。Company Logo案例分析案例分析名称名称我国创新型企业技术创新与出口贸我国创新型企业技术创新与出口贸易关系研究易关系研究数据数据来源来源规模以上工业企业普查数据(规模以上工业企业普查数据(2006年)年)创新型创新型企业企业有新产品产出和研发支出的企业有新产品产出和研发支出的企业Company LogoLOGO Cycle DiagramTextTextTextTextTextCycle nameAdd Your TextCompany LogoDiagramTe

23、xtTextTextAdd YourTitle TextText 1Text 2Text 3Text 4Text 5Add YourTitle TextText 1Text 2Text 3Text 4Text 5TextTextCompany LogoMarketing DiagramConceptConceptConceptConceptconceptconceptConceptConceptCompany LogoDiagramAdd Your TextAdd Your TextAdd Your TextAdd Your TextAdd Your TextAdd Your TextText

24、Company LogoDiagramYour TextYour TextYour TextYour TextYour TextYour TextYour TextYour Text2001200220032004Company LogoBlock DiagramTEXTTEXTTEXTTEXTTEXTTEXTTEXTTEXTCompany LogoTableTitleTitleTitleTitleTitleTitleOOOOOTitleOOOOOTitleOOOOOTitleOOOOOTitleOOOOOTitleOXOXOCompany LogoText1Text2Text3Text4Text53-D Pie ChartCompany Logo

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 生活常识

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com