概率统计统计描述案例.ppt

上传人:wuy****n92 文档编号:69530834 上传时间:2023-01-06 格式:PPT 页数:17 大小:452.60KB
返回 下载 相关 举报
概率统计统计描述案例.ppt_第1页
第1页 / 共17页
概率统计统计描述案例.ppt_第2页
第2页 / 共17页
点击查看更多>>
资源描述

《概率统计统计描述案例.ppt》由会员分享,可在线阅读,更多相关《概率统计统计描述案例.ppt(17页珍藏版)》请在得力文库 - 分享文档赚钱的网站上搜索。

1、 上市公司年报数据分析上市公司年报数据分析 本案例以沪深股市制造业上市公司为对象,介绍了数据总体的统计处理过程.数据整理是统计分析的基础工作,在总体规模很大,数据量浩瀚、分布未知的情况下,如何对总体数据进行整理分类,描述总体分布及进一步分析总体各特征间的相互关系是对总体正确认识的关键。1/6/202311.上市公司年报财务数据统计分析的对象上市公司年报财务数据统计分析的对象 本案例研究的本案例研究的总体范围总体范围确定为截止确定为截止2000年年4月月30日如期公布年报的制造业日如期公布年报的制造业560家上市公司。家上市公司。本案例所引用资料取自本案例所引用资料取自上海证券报上海证券报,包,

2、包括了制造业括了制造业560家上市公司。共选有家上市公司。共选有8个财务指个财务指标:总资产、净利润、主营业务收入、股东权标:总资产、净利润、主营业务收入、股东权益、每股收益、每股净资产和股东权益比率。益、每股收益、每股净资产和股东权益比率。其中,前其中,前4个为反映资产、收益方面的总量指个为反映资产、收益方面的总量指标,后标,后4个为反映盈利能力、业绩水平的相对个为反映盈利能力、业绩水平的相对指标。指标。1/6/202322 2数据的初步分析数据的初步分析制造业上市公司行业结构制造业上市公司行业结构 根据根据上市公司分类指引上市公司分类指引,制造业,制造业分为分为10个行业种类,编码为个行业

3、种类,编码为C0、C1、C2、C9。从上述资料经计数整理后即可得到如从上述资料经计数整理后即可得到如表表1的频数分布表。的频数分布表。1/6/20233 从该表中可以知道上市公司的行业结构。从该表中可以知道上市公司的行业结构。1999年年560个制造业上市公司中,传统产业个制造业上市公司中,传统产业占了较大比重。占了较大比重。代码代码行业分类行业分类上市公上市公司数司数比重(比重(%)C0C0食品、饮料食品、饮料48488.578.57C1C1纺织、服装、皮毛纺织、服装、皮毛45458.048.04C2C2木材、家具木材、家具2 20.360.36C3C3造纸、印刷造纸、印刷16162.862

4、.86C4C4石油、化学石油、化学13013023.2123.21C5C5橡胶、塑料橡胶、塑料10101.791.79C6C6金属、非金属金属、非金属969617.1417.14C7C7机械、仪表、设备机械、仪表、设备15115126.9626.96C8C8通讯、电子通讯、电子51519.119.11C9C9其他其他11111.961.96合合 计计560560100.00100.00表表1 制造业上市公司行业分布制造业上市公司行业分布1/6/202343、数据整理与描述、数据整理与描述1)编制按各财务指标的频数分布表)编制按各财务指标的频数分布表(1)将数据顺序排列。)将数据顺序排列。(2)

5、计算描述统计指标。)计算描述统计指标。(3)分析描述统计指标)分析描述统计指标比较平均数、众比较平均数、众数、中位数的大小;偏度系数的大小、方数、中位数的大小;偏度系数的大小、方向等。向等。(4)确定组数和组距确定组数和组距(5)整理成频数分布和直方图(或其他图形)整理成频数分布和直方图(或其他图形),显示总体分布特征。,显示总体分布特征。1/6/202352 2)制造业公司主要财务指标的分布)制造业公司主要财务指标的分布(1)总资产分布数列和直方图)总资产分布数列和直方图样本均值样本均值样本均值样本均值中位数中位数中位数中位数标准差标准差标准差标准差 样本方差样本方差样本方差样本方差峰值峰值

6、峰值峰值偏度偏度偏度偏度极差极差极差极差最小值最小值最小值最小值最大值最大值最大值最大值计数计数计数计数15,8315.115,8315.115,8315.115,8315.19,5296.99,5296.99,5296.99,5296.921,2291.321,2291.321,2291.321,2291.34.51E+104.51E+104.51E+104.51E+1030.1907730.1907730.1907730.190774.7051284.7051284.7051284.705128217,8598217,8598217,8598217,85981,2256.691,2256.

7、691,2256.691,2256.69219,0846219,0846219,0846219,0846560560560560总资产描述统计总资产描述统计1 1 从描述统计从描述统计1看,看,560家公司的总资产呈高度家公司的总资产呈高度偏态。总资产最大值和偏态。总资产最大值和最小值相差近最小值相差近200倍。倍。将将6个总资产个总资产100亿亿和和7个个2亿元以下的数据亿元以下的数据作为极值舍去,计算得作为极值舍去,计算得到描述统计到描述统计2。1/6/20236样本均值样本均值样本均值样本均值中位数中位数中位数中位数标准偏差标准偏差标准偏差标准偏差样本方差样本方差样本方差样本方差峰值峰值

8、峰值峰值偏度偏度偏度偏度极差极差极差极差最小值最小值最小值最小值最大值最大值最大值最大值计数计数计数计数14,4640.714,4640.714,4640.714,4640.79,5410.489,5410.489,5410.489,5410.4814,9424.914,9424.914,9424.914,9424.92.23E2.23E2.23E2.23E101010109.9163759.9163759.9163759.9163752.8852382.8852382.8852382.88523895,5269.695,5269.695,5269.695,5269.62,1671.492,1

9、671.492,1671.492,1671.4997,6941.197,6941.197,6941.197,6941.1547547547547总资产描述统计总资产描述统计2 2 由总资产描述统计由总资产描述统计2表看出,均值表看出,均值14.5亿元,亿元,中位数中位数9.5亿元,标准亿元,标准差差15亿元,此时的标亿元,此时的标准差和偏度系数都降准差和偏度系数都降低了,说明数据间的低了,说明数据间的差异小了。但仍呈右差异小了。但仍呈右偏态。偏态。考虑以考虑以7.5亿元为组亿元为组距,由于距,由于100亿元以上亿元以上只有只有6家,将家,将105亿元亿元以上并为一组,组数以上并为一组,组数=1

10、5。分组后频数分布。分组后频数分布及直方图如表及直方图如表2和图一和图一所示。所示。1/6/20237分组(亿元)分组(亿元)频数频数频率(频率(%)7.5 以下以下7.51515.22.522.5303037.537.5454552.552.5606067.567.5757582.582.5909097.597.5105105以上以上20920919219264643333181815154 42 24 46 62 21 13 31637.3237.3234.2934.2911.4311.435.895.893.213.212.682.680.710.710.360.360.710.711.

11、071.070.360.360.180.180.540.540.180.181.071.07合计合计560560100.00100.00 表表2 560家上市公司总资产分组统计家上市公司总资产分组统计1/6/20238 从图表中可从图表中可以知道,制造以知道,制造业中,总资产业中,总资产8866亿元,平亿元,平均规模在均规模在15亿亿元左右。元左右。82%的上市公司总的上市公司总姿产在姿产在22.5亿亿元以下,元以下,100亿亿元以上的只有元以上的只有1%。1/6/20239(2)净净利利润频润频数分布和数分布和直直方方图图 净利润分布呈右偏态。以净利润分布呈右偏态。以6500万元为组距,可分

12、万元为组距,可分17组。组。分组后分组后3.25亿元以上各组亿元以上各组不仅频数少,而且有两组不仅频数少,而且有两组频数为频数为0。这种情况下可。这种情况下可考虑合并这些组,因为合考虑合并这些组,因为合并后的数列并未影响总体并后的数列并未影响总体特征的描述。将亏损特征的描述。将亏损1.3亿亿元以下的公司合并为一组,元以下的公司合并为一组,3.25亿元以上的公司合并亿元以上的公司合并为一组,组数减少到为一组,组数减少到9组组.见表见表23和图和图22。样本均值样本均值中位数中位数标准差标准差样本方差样本方差峰值峰值偏度偏度极差极差最小值最小值最大值最大值求和求和计数计数6669.486669.4

13、84120.1644120.16412217.4812217.481.49E+081.49E+0811.3334411.333442.4855722.485572112886.5112886.537417.937417.975468.675468.637349133734913560560 净利润描述统计净利润描述统计 1/6/202310净利润分组(万元)净利润分组(万元)频频 数数 (个)(个)频频 率率 (%)1300013000以下以下130001300065006500650065000 00 065006500650065001300013000130001300019500195

14、0019500195002600026000260002600032500325003250032500以上以上14141010222233233211211224241313161617172.502.5079793.933.9359.2959.2920.0020.004.294.292.322.322.862.863.043.04合合 计计560560100.00100.00 图图22 560家上市家上市公司净利润分布公司净利润分布 表表23 560家上市家上市公司净利润分布公司净利润分布1/6/202311 从整理后的净利润的资料我们注意到:从整理后的净利润的资料我们注意到:第一,制造业

15、中,第一,制造业中,1999年度年度46家公司亏损,家公司亏损,亏损面亏损面8.2%,最多的亏损,最多的亏损3.7亿元。亿元。第二,制造业第二,制造业1999年度净利润总额年度净利润总额373.9亿元,亿元,受亏损公司的影响,受亏损公司的影响,560家公司总体平均利家公司总体平均利润只有润只有6500万元。万元。79%的上市公司净利润的上市公司净利润在在70万万1.3亿元之间。亿元之间。第三,年净利润在第三,年净利润在4.5亿元以上的公司有亿元以上的公司有16个,个,不足总数的不足总数的3%,但它们的净利润占到制造,但它们的净利润占到制造业全行业的业全行业的25.5%,充分体现了大型国企确,充

16、分体现了大型国企确实是国民经济的脊梁。实是国民经济的脊梁。1/6/202312(3 3)每股收益分布数列和直方图)每股收益分布数列和直方图样本均值样本均值中位数中位数标准差标准差样本方差样本方差峰值峰值偏偏 度度区域区域最小值最小值最大值最大值求和求和计数计数0.1994270.1994270.22250.22250.2733520.2733520.0747210.0747216.756416.756411.511821.511822.6322.6321.281.281.3521.352111.6792111.6792560560每股收益描述统计每股收益描述统计 1 从描述统计指标看,均值、从

17、描述统计指标看,均值、中位数比较接近,偏度系数中位数比较接近,偏度系数也不很大。也不很大。确定组数为确定组数为10组,组,组距组距=2/10=0.2,极值用开口,极值用开口组处理。见表组处理。见表24 和图和图23。1/6/202313图图23 560家上市公家上市公司每股收益分布司每股收益分布 分分 组组频数(个)频数(个)频率频率(%)0.60.6以下以下0.60.60.40.40.40.40.20.20.200.2000.200.20.20.40.20.40.40.60.40.60.60.80.60.80.81.00.81.01.01.0以上以上14146 613131313197197

18、231231606019196 61 12.502.501.071.072.322.322.322.3235.1835.1841.2541.2510.7110.713.393.391.071.070.180.18合合 计计560560100.00100.00表表24 560家上市公司每家上市公司每股收益分组统计股收益分组统计1/6/202314 净资产收益率是评价净资产盈利能力的综净资产收益率是评价净资产盈利能力的综合指标,他代表了总体的或行业的盈利水合指标,他代表了总体的或行业的盈利水平。从统计资料看到:平。从统计资料看到:第一,第一,1999年度,制造业的总体净资产收益年度,制造业的总体净

19、资产收益率率19%。第二,第二,8%的公司亏损,与每股收益分析的结的公司亏损,与每股收益分析的结论一致;并且有两个公司净资产为负数,论一致;并且有两个公司净资产为负数,以资不抵债。以资不抵债。第三,第三,34%的公司净资产收益率在的公司净资产收益率在0.1%8%之间;之间;48%的公司在的公司在0.8%16%之间。之间。第四,第四,8%的公司净资产在的公司净资产在16%32%的高水的高水平上。平上。1/6/2023154、数据整理和分析的、数据整理和分析的客客观评观评价价 整理频数分布的时候借助于描述指标的判整理频数分布的时候借助于描述指标的判断断,使统计整理工作有了着眼点当面对纷繁的、使统计

20、整理工作有了着眼点当面对纷繁的、大量的原始数据大量的原始数据,总体的分布及数据的分布特总体的分布及数据的分布特征根本无从得知征根本无从得知.因此编制数据的频数分布从因此编制数据的频数分布从那里着手呢那里着手呢?根据的是什么呢根据的是什么呢?当然是数据总当然是数据总体的几个主要特征值体的几个主要特征值:样本均值、中位数、极样本均值、中位数、极差、样本方差、偏度等差、样本方差、偏度等.应用统计软件,这些特征值很容易得到应用统计软件,这些特征值很容易得到.掌握了这些特征值掌握了这些特征值,对分组的组数、组距的确对分组的组数、组距的确定才有了依据定才有了依据.所以案例提出的方法所以案例提出的方法,解决了解决了整理频数分布的可操作性问题。整理频数分布的可操作性问题。1/6/202316 同时注意到,频数分布的编制没同时注意到,频数分布的编制没有固定的模式有固定的模式,因此不是唯一的因此不是唯一的,采采用不同的组距、组限用不同的组距、组限,就有不同的就有不同的分布数列分布数列.如何评价哪一个数列最如何评价哪一个数列最恰当或者最确切反映总体分布特征恰当或者最确切反映总体分布特征是一个值得研究的问题。是一个值得研究的问题。1/6/202317

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 大学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知得利文库网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号-8 |  经营许可证:黑B2-20190332号 |   黑公网安备:91230400333293403D

© 2020-2023 www.deliwenku.com 得利文库. All Rights Reserved 黑龙江转换宝科技有限公司 

黑龙江省互联网违法和不良信息举报
举报电话:0468-3380021 邮箱:hgswwxb@163.com