1、统计教学案例二上市公司年报数据分析案例经统计调查取得数据后,需要通过统计整理、综合指标计算与相关回归分析等方法技术对总体数据进行处理,以认识总体变量分布状态(如正态分布) 、特征表现(如结构相对数、平均数和标准差) 、相关关系(如相关系数)和变化规律(如回归模型) ,从而了解事物或现象的本质及其依存因素。其中统计整理技术包括总量指标、相对指标、平均指标和标志变异指标的揭示,他们的计算既是对总体基本特征的描述,又是对事物或现象进一步定量研究的基础;相关和回归是研究总体各事物或现象间相互关系的定量分析,用以测定不同特征相互联系的紧密程度,揭示变化形式和规律。本章案例主要通过对总体静态数据处理过程的
2、介绍,帮助读者掌握统计整理、指标描述和相关回归分析技术结合运用的技术与经验。本章由 1 个大型案例构成,案例以沪深股市制造业上市公司为对象,系统介绍了静态数据总体的统计处理过程,包括分布描述、分类研究和相关因素分析。上市公司年报数据分析案例的教学目的:数据整理是统计分析的基础工作,在总体规模很大,数据量浩瀚、分布未知的情况下,如何对总体数据进行整理分类,描述总体分布及进一步分析总体各特征间的相互关系是对总体正确认识的关键。由于具体的工作过程与教科书的知识点讲授顺序并不完全一致,因此本案例通过对 1999 年沪深股市制造业上市公司年报数据分析过程的介绍,给读者以处理总体静态数据的思路和技巧,从而
3、训练读者解决实际问题的能力。案例的背景分析与数据资料一、案例的现实意义上市公司的经营业绩与其股票价格、市场价值息息相关,因此反映上市公司经营业绩的定期公开披露的中期会计报告、年度会计报告就成为社会各界密切关注的重要信息之一。对所有上市公司的财务报告进行统计整理和分析,把握上市公司整体的经营状况、经营业绩的水平和变化趋势,无论是对投资选择,还是政府的决策与监督,都是不可或缺的。本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析,这对于投资者、投资咨询人员或是理论界研究者,都具有实际的指导意义。通过本案例的学习讨论,有助于大家掌握统计描述和相关回归分析的方法,同时积累应用这些方法的实
4、际经验和教训。二、案例所依托的总体及其现状与研究目的(一)案例所依托的客体本案例所依托的客体是 1999 年上市公司年报中的有关财务指标。1999 年末,沪、深两市共有上市公司 949 家。这些上市公司分布在 13 个行业部门。根据中国证监会的上市公司分类指引中规定的分类方法,其中制造业共有 578 家,占 60.91%。总股本 1938 亿元,占 62.73%,制造业是上市公司最集中的行业。截止 2000 年 4 月 30 日,已公布年报的有 560 家。所以本案例研究的总体范围确定为如期公布年报的制造业 560 家上市公司。(二)案例研究的目的与任务1 上市公司年报财务数据统计分析的目的通
5、过对制造业 1999 年报有关数据进行系统的统计整理、描述和回归分析,揭示 1999 年制造业上市公司主要财务指标的总体分布、分行业的经营业绩水平和重要特征,从中掌握认识总体分布特征和数量变化的技巧和方法,提高用统计思想和方法解决实际问题的能力。2上市公司年报财务数据统计分析的任务对纷繁的数据进行不同的分类、分组、汇总、综合、分析、归纳、推断,显示上市公司财务报告中的主要财务指标的分布形态和主要特性,寻找财务指标之间的相互关系和表现规律。3上市公司年报财务数据统计分析的对象本案例所引用资料取自上海证券报 ,包括了制造业 560 家上市公司。共选有 8 个财务指标:总资产、净利润、主营业务收入、
6、股东权益、每股收益、每股净资产和股东权益比率。其中,前 4 个为反映资产、收益方面的总量指标,后 4 个为反映盈利能力、业绩水平的相对指标。4数据的初步分析制造业上市公司行业结构在制造业中,生产不同产品的企业或公司,具有不同的规模,占有不等的资源要素,他们的总股本、净利润、净资产收益率必然存在很大的差异。为了深入认识总体,首先要对制造业按其经济活动的特点进行行业分类。根据上市公司分类指引 ,制造业进一步分为 10 个行业种类,编码为 C0、C1、C2、C9。分类统计属于定名测定。从上述资料经计数整理后即可得到如表一的分布数列。表 21 制造业上市公司行业分布代 码 行业分类 上市公司数 比重(
7、%)C0 食品、饮料 48 8.57C1 纺织、服装、皮毛45 8.04C2 木材、家具 2 0.36C3 造纸、印刷 16 2.86C4 石油、化学 130 23.21C5 橡胶、塑料 10 1.79C6 金属、非金属 96 17.14C7 机械、仪表、设备151 26.96C8 通讯、电子 51 9.11C9 其他 11 1.96合 计 560 100.00这是一个品质标志分组的分布数列。从该数列中可以知道上市公司的行业结构。1999 年 560个制造业上市公司中,27%是机械、仪表、设备制造业(包括汽车、船舶、摩托车、家电等) ;23%是石化类行业;而冶金、钢铁等金属非金属类公司占 17
8、%;通讯电子章 9%。所以,制造业上市公司中传统产业占了较大比重。这些行业中大部分是国有或国有控股企业,是国企改革中率先建立现代企业制度进入资本市场的排头兵。行业的分布也体现了国家的产业政策导向,在 1999 年新发行的 A 股中,大盘股和高科技股明显增多,有力地支持了国企改革和高科技企业的发展,推动了上市公司的行业结构优化。方 案 设 计一、案例设计的思路本案例研究的总体对象是某一特定时间的静态数据集,为了对它有一个全面和透彻的认识,一般应对其进行基本的特征描述和揭示各特征间主要的相互关系。根据这一目的,本案例按照如下顺序对数据进行处理:1分别对总体个单位的数量标志按值的大小作升序排列,以大
9、概认识个变量的变化范围及其一般水平。2分别计算总体个变量的特征值,进一步抽象认识个变量的分布特征,包括算术平均数、众数、方差、峰度度、偏度等。3分别根据特征指标绘制各变量的分布图,以形成对各变量分布的直观认识。4分别按品质标志和数量标志对总体进行分类,通过计算派生指标,以深入认识总体各指标在不同类别间的差异,包括总体结构、强度,比例关系等。5分别对总体各指标进行相关分析,了解各指标间的依存关系,在相关关系成立的基础上进行回归分析,从而更深层次地认识总体的规律与特征。6在上述研究分析的基础上给出关于对对象的定性认识结论。二、案例设计的工作过程(一)数据整理与描述1编制按各财务指标的变量数列(1)
10、 将数据顺序排列。(2) 计算描述统计指标。在 Excel“工具”的“数据分析”中, “描述统计”提供了所分析数据的主要描述指标和有关信息。其内容是;平均算术平均数,即 =xn标准误差抽样平均误差,即 中值中位数,即 Me;模式众数,即 Mo;标准偏差标准差,即 ;样本方差方差,即 2峰值峰度,即 4m偏斜度偏度,即 ;3区域全距,即最大值减最小值;求和标志总量;计数总体单位总数;最大(K)第 K 个最大值;最小(K)第 K 个最小值;置信度“数据分析”中默认概率为 95%(也可自行选择)的 1/2 误差范围。(3)分析描述统计指标比较平均数、众数、中位数的大小;偏度系数的大小、方向等。(4)
11、确定组数和组距当偏度系数不大时,用斯特吉斯经验公式确定组数;偏度系数较大、分布明显偏态时,以平均数为中心,以 K 倍标准差为组距。(5)整理成频数分布和直方图(或其他图形) ,显示总体分布特征。2制造业公司主要财务指标的分布(1)总资产分布数列和直方图总资产描述统计 1平均标准误差中值模式标准偏差;样本方差峰值偏斜度区域最小值最大值求和计数置信度(95%)158315.18970.94695296.9212291.34.51E+1030.190774.705128217859812256.6921908468865645256017620.89总资产描述统计 2平均标准误差中值模式标准偏差;样
12、本方差峰值偏斜度区域最小值最大值求和计数置信度(95%)144640.76388.94895410.48149424.92.23E=109.9163752.885238955269.621671.49976941.17911847854712549.92从描述统计 1 看,560 家公司的总资产呈高度偏态。总资产最大值是上海石化 219 亿元,最小值是 ST 黔凯涤 1.2 亿元,相差近 200 倍。将 6 个总资产 100 亿和 7 个 2 亿元以下的数据作为极值舍去,计算得到描述统计 2,此时的标准差和偏度系数都降低了,说明数据间的差异小了。但仍呈偏态,不能用斯特吉斯经验确定组数。不论何种
13、分布,均值和方差其分布的两个主要特征值。根据切比雪夫定理,可以平均数为中心,以 K 倍的标准差为组距,因为此时平均数 K 倍的标准差所涵盖的数据范围不小于 11/。2本例中,均值 14.5 亿元,中位数 9.5 亿元,标准差 15 亿元,说明 560 家公司的总资产分布为右偏态。若以 1 个标准差为组距,则中位数以下部分的描述势必过于概括。所以考虑用 1/2 标准差,即 7.5 亿元为组距,由于 100 亿元以上只有 7 家,将 105 亿元以上并为一组,组数=15。分组后变量数列及直方图如表二和图一所示。表 22 560 家上市公司总资产分组统计分组(万元) 频数 频率(%)75000 以下
14、7500015000015000022500022500030000030000037500037500045000045000052500052500060000060000067500067500075000075000082500082500090000090000097500097500010500001050000 以上2091926433181542462131637.3234.2911.435.893.212.680.710.360.711.070.360.180.540.181.07合计 560 100.00从图表中可以知道,制造业中,总资产 8866 亿元,平均规模在 15
15、亿元左右。82%的上市公司总姿产在 22.5 亿元以下,100 亿元以上的只有 1%。在各行业中,总资产规模最大的是 C8通信电子行业20.3 亿元,最低的是 C2木材家具业 6.38 亿元,另外,C4石油化工、C5橡胶塑料、C6金属非金属的总资产规模在平均之上。频 数050100150200250750001500002250003000003750004500005250006000006750007500008250009000009750001050000 其 他图 21 560 家制造业公司总资产分布(2)净利润分布数列和直方图净利润描述统计 平均标准误差中值模式标准偏差;样本方差峰
16、值偏斜度区域最小值最大值求和计数置信度(95%)6669.48516.28284120.164# N/A12217.481.49E+0811.333442.485572112886.537417.975468.637349135601014.092净利润分布呈右偏态。以 1/2 标准差 6500 万元为组距,可分 17 组。分组后 3.25 亿元以上各组不仅频数少,而且有两组频数为 0。这种情况下可考虑合并这些组,因为合并后的数列并未影响总体特征的描述。见表 23 和图 22。表 23 560 家上市公司净利润分布净利润分组(万元) 频 数 (个) 频 率 (%)13000 以下1300065
17、00650000650065001300013000195001950026000260003250032500 以上141022332112241316172.50793.9359.2920.004.292.322.863.04合 计 560 100.00频 数050100150200250300350-13000 -6500 0 6500 13000 19500 26000 32500 其 他净利润分组(万元)图 22 560 家上市公司净利润分布将亏损 1.3 亿元以下的公司合并为一组,3.25 亿元以上的公司合并为一组,组数减少到 9 组,总体仍为右偏态。从整理后的净利润的资料我们注意
18、到:第一,制造业中,1999 年度 46 家公司亏损,亏损面 8.2%,最多的亏损 3.7 亿元。第二,制造业 1999 年度净利润总额 373.9 亿元,受亏损公司的影响,560 家公司总体平均利润只有 6500 万元。79%的上市公司净利润在 70 万1.3 亿元之间。第三,上海汽车、邯郸钢铁、上海石化、仪征化纤、首钢股份等大型国企全年利润均在 7 亿元以上;年净利润在 4.5 亿元以上的公司有 16 个,不足总数的 3%,但它们的净利润占到制造业全行业的 25.5%,充分体现了大型国企确实是国民经济的脊梁。第四,进一步研究各行业的利润水平,可以看到有三个行业高与总体水平;C0食品饮料净利
19、闰0.79 亿元;C6金属非金属净利闰 0.85 亿元;C8通信电子净利闰 1 亿元。(3)每股收益分布数列和直方图每股收益描述统计 1 平均标准误差中值模式标准偏差;样本方差峰值偏斜度区域最小值最大值求和计数置信度(95%)0.1994270.0115510.22250.210.2733520.0747216.756411.511822.6321.281.352111.67925600.022689每股收益描述统计 2平均标准误差中值模式标准偏差;样本方差峰值偏斜度区域最小值最大值求和计数置信度(95%)0.2049430.0105710.2230.210.2492550.0621284.9
20、121741.274991.88910.980.9091113.94825560.020764每股收益是一强度相对指标。从描述统计指标看,舍弃一个最大值后,均值、中位数、众数比较接近,偏度系数也不很大。尝试按经验公式确定组数:组数=1+3.322560=10;组距=2/10=0.2,极值用开口组处理。见表 24 和图 23。 表 24 560 家上市公司每股收益分组统计分 组 频数(个) 频率(%)0.6 以下0.60.40.40.20.2000.20.20.40.40.60.60.80.81.01.0 以上14613131972316019612.501.072.322.3235.1841.
21、2510.713.391.070.18合 计 560 100.00频 数050100150200250-0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1每股收益分组(元)图 23 560 家上市公司每股收益分布 每股收益是按总股本平均的净利润,它排除了股本规模大小对净利润水平高低影响,反映了上市公司经营业绩水平。不仅在行业之间,而且可以在公司之间进行比较。从表 24 图 23 看 560 家公司每股收益的特点:第一,1999 年制造业的每股收益的分布略乘左偏态,即平均数为 0.2 元,但是相对多数的公司每股收益高于 0.2 元。第二,35%的公司在 0.010.2 元的微利水
22、平,52%的公司盈利水平再 0.20.6 元之间。26 家公司盈利水平较高,在 0.6 元以上,但只占 4.5%。1999 年的改制表状元是五粮液,达到每股收益 1.35 元。第三,分行也看,经营业绩差别的行业因素非常明显:最高的是 C0食品饮料,达到每股收益0.31 元;大于等于每股收益 0.2 元的还有 C1纺织、服装,C5橡胶塑料, C8 同新点子,C9其他;最低的事 C2木材家具,只有 0.08 元。(4)净资产收益率分布数列和直方图净资产收益率 1平均标准误差中值模式标准偏差;样本方差峰值偏斜度区域最小值最大值求和计数置信度(95%)2.9714771.9932569.046.214
23、7.084752216.974117.588910.1028736.156639.5396.6261658.085583.915216净资产收益率 2平均标准误差中值模式标准偏差;样本方差峰值偏斜度区域最小值最大值求和计数置信度(95%)8.0063860.3522289.146.218.18504166.99496.8819081.6310269.2634.9234.344323.4485400.691909由于资料中两个公司(0515PT 渝钛白和 600818ST 永久)的净利润 净资产为负值,所以此处只有58 个公司的数据。558 个公司的净资产旅呈高度左偏态。净资产收益率过高或过低,
24、都数不正常情况。舍弃 40%以上和40%以下的 18 个极端值后,描述指标基本正常。以 1 倍标准差 8%为组距、48%以上和48%一下合并各 1 组,共分 14 组。表 25 和图 24 显示,集中趋势非常明显。表 25 560 家公司净资产收益率分组统计分组(%) 频数 频率(%)小于48 13 2.33484040323224241616880088161624243232404048大于 4812568101902703973130.180.360.904.081.431.7934.0548.396.991.250.540.180.54合计 558 100.00频 数050100150
25、200250300-48 -40 -32 -24 -16 -8 0 8 16 24 32 40 48 其 他净资产收益率分组(%)图 24 560 家上市公司净资产收益率分布净资产收益率是评价净资产盈利能力的综合指标,他代表了总体的或行业的盈利水平。从统计资料看到:第一,1999 年度,制造业的总体净资产收益率 9%(这里采用了中位数,因为忽略极值厚中位数没有变化,但平均数却差了几倍,而净资产收益率极端值时有个别特殊原因所致) 。第二,8%的公司亏损,与每股收益分析的结论一致;并且有两个公司净资产为负数,以资不抵债。第三,34%的公司净资产收益率在 0.1%8%之间;48%的公司在 0.8%1
26、6%之间。第四,8%的公司净资产在 16%32%的高水平上,从行业看,这些公司集中在生物制药、通信电子、汽车等高新技术产业,显示出发展最快、盈利水平最强的势头。3制造业各行业主要财务指标的分布接下来利用符合分组表统计表的形式,总体分组的划分,展示制造业内部各行业的净利润、每股收益、净资产收益率的分布特征。(1)制造业各行业净利润分布频数统计表和频率统计表合计栏显示的是总体的净利润分布频数或频率,其他各栏显示的是个行业的分布(见表 26、表25) 。表 26 制造业各行业净利润分布统计(频数)代码净利润分组(万元) 行业分类小于-1.3-1.3-0.65-0.65000.650.651.31.3
27、1.951.952.62.63.25大于 3.25合计C0 食品、饮料 1 27 14 3 1 1 1 48C1 纺织、服装、皮毛 1 1 2 27 13 1 45C2 木材、家具 1 1 2C3 造纸、印刷 1 12 3 16C4 石油、化工 2 2 5 81 28 6 2 4 130C5 橡胶、塑料 8 1 1 10C6 金属、非金属 3 4 2 53 17 4 3 5 5 96C7 机械、仪表、设备 6 10 94 24 4 5 4 4 151C8 通信、电子 2 2 1 22 10 3 4 4 3 51C9 其他 7 2 2 11合计 14 10 22 332 112 24 13 16
28、 17 560从表 26、27 中可以看到:第一,总共 45 个亏损公司,占全部公司的 8%,他们的行业间分布是:C7机械、仪表、设备行业亏损面最大,有 16 家,占行业 10.7%;其次是 C8、C6 和 C1分别为 9.8%、9.4%、8.8%;C2木材家具仅有 2 家公司,亏损 1 家。第二,C5橡胶、塑料和 C9其他行业无亏损企业,且净利润水均衡,集中在 019500 万元。第三,净利润绝对水平的高低与行业类别有关联,3 亿元以上净利润集中在酿酒、石化、冶金、电子通信设备等行业;利润水平较低的有纺织、木材家具及印刷、造纸行业。 表 27 制造业各行业净利润分布统计(频率%)代 净利润分
29、组 小 - - 0 0.6 1.3 1.9 2.6 大码(万元) 行业分类于-1.31.3-0.650.6500.6551.31.9552.63.25于 3.25合计C0 食品、饮料 2.1 56.329.26.3 2.1 2.1 2.1 100.0C1 纺织、服装、皮毛 2.2 2.2 4.4 60.028.92.2 100.0C2 木材、家具 50 50.0100.0C3 造纸、印刷 6.3 75.018.8100.0C4 石油、化工 1.5 1.5 3.8 62.321.54.6 1.5 3.1 100.0C5 橡胶、塑料 80.010.010.0100.0C6 金属、非金属 3.1 4
30、.2 2.1 55.217.74.2 3.1 5.2 5.2 100.0C7 机械、仪表、设备 3.3 6.7 62.716.02.7 3.3 2.7 2.7 100.0C8 通信、电子 3.9 3.9 2.0 43.119.65.9 7.8 7.8 5.9 100.0C9 其他 63.618.218.2100.0合计 2.3 1.8 3.9 59.420.04.3 2.3 2.9 3.0 100.0(2)制造业各行业每股净收益分布频数统计和频率统计表 28、29 显示的是不同行业每股收益的不同水平的分布。在 91.8%的盈利公司中,若每股收益 0.6元以上为绩优股,则绩优股的比率 4.7%。
31、绩优股的行业特征也非常明显:食品行业最高,为 8.4%,其后依次是通信电子行业 7.9%、机械仪表设备 7.3%。从表面上看其他行业最高(9.1%) ,但是其他行业属于主营收入不明显的“收容”类,其较高的每股收益得益于多元化经营,因此在比较时,应予以忽略。表 28 制造业各行业每股收益分布统计(频数)代码净利润分组(元) 行业分类小于-0.6-0.6-0.4-0.4-0.2-0.2000.20.20.40.40.60.60.80.8 1.0大于1.0合计C0 食品、饮料 1 10 24 9 2 1 1 48C1 纺织、服装、皮毛 1 2 1 11 27 1 2 45C2 木材、家具 1 1 2
32、C3 造纸、印刷 1 8 7 16C4 石油、化工 3 1 2 3 58 52 9 2 130C5 橡胶、塑料 4 4 2 10C6 金属、非金属 2 6 1 32 43 10 2 96C7 机械、仪表、设备 2 3 4 7 56 52 16 9 2 151C8 通信、电子 4 1 14 16 12 3 1 51C9 其他 4 5 1 1 11合计 14 6 13 13 197 231 60 19 6 1 560表 29 制造业各行业每股收益分布统计(频率%)代码净利润分组(元) 行业分类小于-0.6-0.6-0.4-0.4-0.2-0.2000.20.20.40.40.60.60.80.8
33、1.0大于1.0合计C0 食品、饮料 2.1 20.950.018.84.2 2.1 2.1 100.0C1 纺织、服装、皮毛 2.2 4.4 2.2 24.460.02.2 4.4 100.0C2 木材、家具 50.050.0100.0C3 造纸、印刷 6.3 50.043.8100.0C4 石油、化工 2.3 0.8 1.5 2.3 44.640.06.9 1.5 100.0C5 橡胶、塑料 40.040.020.0100.0C6 金属、非金属 2.1 6.3 1.0 33.344.810.42.1 100.0C7 机械、仪表、设备 1.3 2.0 2.6 4.6 37.134.410.6
34、6.0 1.3 100.0C8 通信、电子 7.8 2.0 27.531.423.55.9 2.0 100.0C9 其他 36.445.59.1 9.1 100.0合计 2.5 1.1 2.3 2.3 35.241.310.73.4 1.1 0.2 100.0(二)相关和回归分析本案例相关和回归分析研究主要是 8 个财务指标间的相互关系问题。各财务指标分别说明上市公司的财务状况的某一侧面。那么这些指标之间有无关系?若有关系,是什么样的关系?通过本案例的探讨,可以帮助我们筛选主要个财务指标作为分析公司业绩变动的因素。1制造业业绩指标之间的关系研究表 210 是 8 个财务指标的两两指标间的线性相
35、关系数。表 210 制造业有关业绩指标相关系数矩阵 净资产收益率净利润净资产总资产 主营业务收入每股收益每股净资产股东权益比率净资产收益率 1净利润 0.248 1净资产 0.074 0.676 1总资产 0.052 0.626 0.929 1主营业务收入 0.072 0.705 0.838 0.910 1每股收益 0.531 0.602 0.150 0.110 0.193 1每股净资产 0.277 0.376 0.270 0.188 0.207 0.599 1股东权益比率 0.311 0.196 0.123 -0.111 -0.081 0.384 0.475 1从相关系数矩阵看,可以得到以下
36、几点共性的结论:(1)主营业务收入与总资产、净资产、净利润这些总量指标显著相关,其中与总资产高度正相关。总资产比较大时,主营业务收入也倾向于比较大,而主营业务收入比较大时,净资产、净利润也比较高。这从实际情况看是可以理解的。在正常情况下,制造业的净资产除了货币资金外,主要就存货和厂房、设备等固定资产。尤其是固定资产,使生产活动的物质技术基础,其数量的多少、技术的高低决定了产品的方向及生产方式,从而决定了收入水平,并且决定了净资产的水平。(2)虽然净资产收益率等于净利润除以净资产,但是净资产除了与净利润微弱相关外,与其他总量指标几乎不相关,也就是说,净资产收益率与资产规模、主营业务收入没有线性关
37、系。主营业务收入水平高低并不决定盈利能力。(3)几个相对指标之间,净资产收益率和每股收益显著正相关。在绝大多数行业中,这种相关程度均高于制造业总体的相关系数 0.53。这一点告诉我们,在说明上市公司经营业绩时,净资产收益率和每股收益两个指标选择其中之一就够了。(4)每股收益、每股净资产作为总量指标的派生指标,除每股收益与净利润外,其他均与净利润、净资产和总资产微弱相关,说明他们抽象了投入规模的不同,可载的行业、各类型的上市公司之间比较。(5)一般地,派生指标与他们的分子指标相关系数要高于与它们的分母指标之间的相关系数。例如:净资产收益率与净利润的相关关系属要高于与净资产的相关系数。(6)就不同
38、行业来看,各指标之间的相关系数均有所差别,表 211 显示:不论从整个制造业还是个行业,主营业务收入、净资产与总资产高度正相关是一致的;在相对指标上产生了分化。其他行业由于主业不明,指标之间相关也很微弱。除此之外,净资产收益率与净利润和每股收益呈现不同程度的相关,机械行业表现得最明显。表 211 制造业上市公司行业有关指标的相关系数行 业 分 类 主营业务收入与总资产净资产与总资产净资产收益率与净利润净资产收益率与每股收益C0 食品、饮料 0.81 0.90 0.59 0.85C1 纺织、服装、皮毛 0.83 0.86 0.64 0.85C3 造纸、印刷 0.85 0.88 0.55 0.92
39、C4 石油、化工 0.96 0.95 0.36 0.89C5 橡胶、塑料 0.96 0.97 0.88 0.94C6 金属、非金属 0.88 0.96 0.46 0.90C7 机械、仪表、设备 0.86 0.85 0.27 0.52C8 通信、电子 0.92 0.93 0.37 0.65C9 其他 0.81 0.39 0.08 0.06合 计 0.91 0.93 0.25 0.532制造业业绩指标间的回归分析回归分析是用函数关系近似描述相关关系的表现形式,它反映的是变量之间的一种变动规律。一般地,选择哪种形式的回归模型可以通过:观察散点图;根据专业知识和经验判断。本案例中,除以上两点外,还可以
40、根据相关系数判断,由于皮尔生积矩相关系数是对两变量线性相关程度的侧度,所以对显著相关程度以上的变量可建立线性回归函数来模拟变量间的关系,即: 210XBY(1)主营业务收入与总资产的回归分析由于主营业务收入与总资产的线性相关系数最大,以主营业务收入为因变量 Y, 总资产为自变量 X,用 560 家制造业公司数据建立一元线性回归方程:10YExcel“工具”栏中“数据分析”的“回归”提供了相关和回归分析的结果:Multiple R相关系数;R Square判定系数;Adjusted R Square调整的判定系数 teSpn1标准误差估计标准误 ;xyS观测值X 、Y 变量的对数。方差分析有关指
41、标含义见表 212。表 212df SdfSMF 值Significance F回归分析 回归偏差自由度回归偏差平方和回归偏差平均平方和残差 剩余偏差自由度剩余偏差平方和剩余偏差平均平方和21nSeR)2,(n总计 总偏差自由度总偏差平方和总偏差平均平方和Intercept截距 a;X Variable一元回归的回归系数 b;标准误差截距 a 的标准差为 ;回归系数 b 的标准误差为 ;abT 统计量对 a 和 b 检验时采用的统计量;P-value P 值;Lower95%, Uooer95%;截距 a 或回归系数 b 的 95%置信峡县、置信上限;此为墨任值,若选择其他置信水平,相应的置信
42、下限、置信上限在后面列出。回归统计Multiple RR SquareAdjusted R Square标准误差观测值0.9098130.827760.82745165866.64560方差分析df SS MS F Significance F回归分析残 差1 1.16E+13 1.16E+13 2681.661 2.8E-215558 2.42E+12 4.34E+09总 计 559 1.41E+13主营业务收入对总资产的一元线性方程:Y = -13975+0.68X回归系数说明, 总资产每增加 1 万元, 制造业主营业务收入平均增加 0.68 万元. 从判定系数看,在总资产对主营业务收入的
43、影响中, 有 83%可以由该线性回归方程解释, 从 t 检验看,回归系数是显著的.回归分析中, 对随机误差, 我们要求它均值为 0, 并假定其服从正态分布. 从 F 检验看,假定成立, 从残差分布图看, 其分布是”杂乱无章”的, 回归方程是合适的.建立回归方程, 不仅为我们描述了主营业务收入和总资产这两个指标间的联系形式,我们利用它还可以进行预报和控制.给定总资产, 可以对主营业务收入水平作区间估计. 本案例样本较大, 当 X=X 时,Y 的 1-a 置信区0间:Y= XYSZ2Coeffici- 标 准 T 统 下限 上限ents 误 差 计 量 P 值 95.0% 95.0% Interc
44、eptX1 Variable -13975 3473.233 -4.02362 6.52E-05 -20797.2 -7152.770.679562 0.013123 51.78476 2.8E-215 0.653786 0.705339这里的 S 是残差平均平方和 MS 的平方根, 即”回归统计”表中的”标准误差”或从”方差分析”XY表资料中可以计算得到; 是 X=X 时回归方程得到的点估计值; 是给定 a 时的临界值。0 2Z例如, 我们想知道, 当 X=20 万元时, 主营业务收入 95%置信区间:点估计值是 =13975+0.68200000=122025(万元)Y估计值标准误差是残差
45、 MS =(4340000000)1/2=6587921主营业务收入置信区间:122025-1.9665879Y122025+1.9665879=-7098251148即总资产为 20 亿元规模时, 估计主营业务收入的上限为 25 亿元,下限可能是亏损的.(2) 净利润与主营业务收入和每股收益的二元回归分析由于指标间的关系在不同行业表现各异, 本案例仅研究了 C8-通信电子行业. 通信电子行业相关系数矩阵见表 212表 212 通信电子有关业绩指标相关系数矩阵净资产收益率净利润 净资产 总资产 主营业务收入每股收益每股净资产股东权益比率净资产收益率 1净利润 0.368 1净资产 0.121
46、0.698 1总资产 0.102 0.752 0.938 1主营业务收入 0.137 0.758 0.790 0.921 1每股收益 0.645 0.703 0.215 0.261 0.336 1每股净资产 0.432 0.692 0.628 0.673 0.682 0.574 1股东权益比率 0.546 0.340 0.235 0.037 0.02 0.444 0.405 1从定性分析角度知道, 净利润与主营业务收入、总资产、净资产有密切关系,其相关系数又从定量角度给予证明. 另外, 从表中还看到, 净利润与每股收益、每股净资产也表现出了显著正相关的关系, 可能的解释在于: 财务指标不是孤立
47、的,它们之间彼此有直接关系的影响, 同时包含了间接关系的影响. 可以用多元回归研究净利润和其他指标的关系. 但是, 在主营业务收入、总资产、净资产之间存在着高度关系, 研究净利润与多个指标的关系时它们或者可以相互替代, 或者必须删去以避免多重共线性对回归模型的影响. 因此, 这里选择主营业务收入和每股收益(它们之间的相关系数 0.34,小于 0.5), 建立净利润与主营业务收入和每股收益的二元线性回归方程.计算结果如下:回归统计Multiple RR SquareAdjusted R Square标准误差观测值0.805140.648250.6335948921.93451方差分析df SS
48、MS F Significance F回归分析残 差2 7.04E+09 3.52E+09 44.23029 1.29E-1148 3.82E+09 79600902总 计 50 1.09E+10净利润 Y 与主营业务收入 X 和每股收益 X 的线性回归方程为:12Y=3329.8+0.05X +35.5X12T 检验的 P 值, 除了截距 B0 的 P 值稍大, B1、B2 的 P 值均小于 0.05, 回归系数是显著的. F 检验的结果证明, 模型整体也是显著的, 即净利润与主营业务收入及每股收益整体看存在线性相关关系.复相关系数 0.81, 高于净利润与主营业务收入及与每股收益的单相关系数.偏相关系数经计算可得: 72.0)34.(1)76.0(8.2)1(2 22)2(1 yyr两个指标对净利润仍旧是正相关的关系, 比较而言, 主营业务收入(X )的影响更大些。1三、数据整理和分析的客观评价(一) 案例对