收藏 分享(赏)

聚类分析和主成分分析在股票市场中的应用.doc

上传人:cjc2202537 文档编号:382099 上传时间:2018-04-03 格式:DOC 页数:10 大小:775KB
下载 相关 举报
聚类分析和主成分分析在股票市场中的应用.doc_第1页
第1页 / 共10页
聚类分析和主成分分析在股票市场中的应用.doc_第2页
第2页 / 共10页
聚类分析和主成分分析在股票市场中的应用.doc_第3页
第3页 / 共10页
聚类分析和主成分分析在股票市场中的应用.doc_第4页
第4页 / 共10页
聚类分析和主成分分析在股票市场中的应用.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、所在学院: 专业: 年级及班级: 姓名: 学号: 密 封 线 第 1 页 共 10 页重庆文理学院试卷答题纸II 类 A 卷20162017 学年 第二学期 期末考试承担单位 数学与财经学院课程名称 多元统计分析 课程类别 专业技术课程考试方式 分散开卷 考试形式 课程论文考试时长 2 周 考试成绩适用对象 2014 级数学与应用数学(金融方向)1 班 论 文1.题 目2.正 文 ( 同 时 提 交 纸 质 版 和 电 子 版 , 数 据 附 在 论 文 电 子 版 后 面 )聚类分析和主成份分析在股票市场中的应用2014 级数学与应用数学(金融方向)1 班 蒲东洋 201402404052多

2、元统计分析评价表评价指标 评价标准 分值 考核得分1、论文题目 选题符合专业,题目命名准确,贴切 5 分2、摘 要 是否简明扼要阐述研究的问题,方法和结论 10 分3、论文引言 对相关问题的阐述,文献相关研究叙述清楚,确定研究的问题和方法 10 分4、论文理论 涉及的理论阐述正确,公式打印正确,理论和后面的研究方法密切相关 15 分5、论文主体指标选择合理,数据收集,数据要真实可靠(标明出处) ,数据与所研究的问题要一致,数据要能满足建模的要求,数据处理分析方法恰当,模型的结果能够支撑所论述的观点30 分6、结论部分结论部分要求层次分明,重点突出,前后连贯,能形成有机整体,论文的结论要与分析的

3、结果相统一15 分7、文本格式 文本格式排版符合规范性要求。 15 分多元统计分析 II 类 A 卷 答题纸 第 2 页 共 10 页总分 签名评语多元统计分析 II 类 A 卷 答题纸第 3 页 共 10 页聚类分析和主成份分析在股票市场中的应用摘要:本文利用聚类分析和主成分分析在 SPSS 中对选用的 20 家上市公司 2017 年第一季度的的财务数据指标进行分析,目的是对股票市场的公司进行综合排名确定对各个股票投资的好坏。聚类分析结果将 20 家上市公司分为 6 个类,并选用每个类的代表公司进行主成分分析,并利用综合评价函数得到它们的综合排名,得到排名结果为(白云机场、包钢股份、宝钢股份

4、、东风汽车、民生银行、浦发银行) ,根据排名可以确定上市公司在股票市场上的相对优劣性,从而选取更好的股票进行投资。一、引言改革开放近 40 多年来,我国经济发展取得了显著成效,经济增长速度和发展水平也取得了令世人瞩目的成绩。从 2003 年到现在,国民经济保持快速增长,市场经济建设高速发展,使人们的投资理财意识和金融意识逐渐增强,在市场经济中担当主力军角色的股票市场,对中国经济发展和社会稳定起着重要作用,并在政府的推动下,逐渐走向成熟与规范,促使更多投资者将眼光投向了股票。然而“股市有风险,入市须谨慎”的口号时常回荡在股民耳旁。股价涨跌无常,股市变幻莫测,所以投资者想从股市中赢得丰厚的回报,仅

5、靠运气是行不通的,我们需要对各上市公司的管理,规模,最重要的是财务状况进行全面的分析与评价,找出真正的具有较高收益率的股票作为投资对象。而通常情况下对上市公司的运营情况和财务状况的评价都是多指标分析,因此我们在做研究时需要选取各公司具有决定性的几个重要指标来做分析。二、研究方向在股票中把具有共同特征的股票群称为板块。股市中的板块可以多种角度来划分,而在每一板块中有几十种甚至上百种股票。面对众多的股票及每个公司大量的财务数据,如何在各个板块众多的股票当中选出具有投资价值的绩优股和潜力股在多元统计分析中的聚类分析和主成分分析的方法,对此问题作出一些探讨。下面我们以 2017年 20 个上证上市公司

6、第一季度的数据作为研究样本,进行具体分析说明。 (研究数据来自西南证券交易软件)三、研究方法及过程(1)系统聚类系统聚类分析是一种将数据所对应的研究对象进行分类的方法。这种方法的共同思路是在提前不知道类别的个数与结构的情况下,分析数据对象之间的相似性或相异性。将这些相似或相异性数据看成对象之间“距离”远近的一种度量,将距离近的对象归为一类,远的即为不同类。在下述试验过程中,我们选用欧氏距离来度量类与类之间的相似程度,聚类方法采用最长距离法。下面我们以样本数据为研究对象,分析中选取了 20 个上市公司 2017 年第一季度的净利润(万元) ,净利润增长率(%) ,营业总收入(万元) ,营业总收入

7、增长率() ,加权净资产收益率() ,资产负债比率() ,等六个反映上市公司综合盈利能力的指标,应用 SPSS 软件的系统聚类过程得到如下结果:多元统计分析 II 类 A 卷 答题纸 第 4 页 共 10 页谱系图为:图 1 系统聚类树状图从上图可以明显看出 2017 年第一季度部分上证公司的营销业绩从 10 那点切下来可以分为 6 类,如第一类中白云机场、XD 中国国、上港集团、日照港、浙能电力,他们的营销业绩基本相同,即买这几家公司的股票风险相当。既然我们已经把数据中的 20 家上证公司进行了分类,那么我们就想知道上述公司的排名,便于投资者选取比较有潜力的股票。(2)主成分分析主成分分析是

8、将多指标化为少数几个综合指标的一种统计分析方法。它通过降维技术,从代表性指标的角度来进行筛选,将多个变量化成少数几个主成分,这些主成分中包含了原始变量的绝大部分信息。这种方法的优点在于它确定的权数是建立在数据本身特性的基础上,不受主观因素的影响。因此我们如果对数据相关性较强的多指标评价,采用主成分分析法十分有利。例如,在上述研究对象中所提到的上市公司2017 年第一季度的业务报表数据,共有六项指标,这些指标之间存在着很大的相关性。表中的每股收益,净资产收益率,以及主营利润增长率指标的变化非常相似。实际上它们反映的都是企业盈利能力,如果用其他方法进行评估,就可能产生过分夸大该趋势的结果。而主成分

9、分析法就避免了这种不足,通过对数据进行变换,能够找出这种主要趋势,并自动赋予权值。所以该方法适用于指标的综合评价,且避免了主观因素的影响,因此在研究中得到了广泛地应用。主成分分析(principal components analysis,PCA) ,也称主分量分析,是由 Hotelling 于 1933 年首先提出的。其基本思想是通过原有变量的少数几个线性组合来解释原有变量所体现的样本变差。设 1X, 2, P为原有的 P 个指标, pnijxX)( 为其标准化观测矩阵,pij)(为其相关系数矩阵, Tiiiu).,(u21(i=1P)为 P 个常数向量。考虑如下线性组合:多元统计分析 II

10、 类 A 卷 答题纸第 5 页 共 10 页niijXuY1为 P 个新指标。 iY的样本方差为 iTiiuY)var(,协方差iTijiv),(co(i,j=1P) 。我们的工作是寻找尽可能少的指标代替原来的 P 个指标,同时要求它们含有尽可能多的原指标的信息且互不相关。指标中信息量的多少用该指标的方差来衡量,方差越大即不相关性越高,即信息含量也就越大,反之亦然。设 的特征根和对应的正交化单位特征向量分别为 0.21P和 12,, P则可以证明当 iiu时,有 i)var(iY, ),(cojiYv, (i,j=1P)此时令:Pk.a21k,k=1,2,P (1)Pkik.b21, k=1,

11、2,P (2)其中 ka表示第 k 个主成分的贡献率, kb表示前 k 个主成分的累积贡献率。累积贡献率就表明了前 k 个主成分有包含信息量占总信息量的比例,一般当 %80bk或90%时,我们就可以考虑用 k 个主成分来表示原有指标而不会损失多少信息。则有综合评价函数为: k2121 .a.)(F XaaXYYax TTTk (3)现将已经分好类的上证公司,第一类、第二类和第四类分别以白云机场、东风汽车、包钢股份为例,利用 SPSS 主成分分析的方法来进行分析。分析结果数据如下表所示:表1 解释程度Initial Eigenvalues Extraction Sums of Squared L

12、oadingsComponentTotal % of Variance Cumulative % Total % of Variance Cumulative %1 3.202 53.370 53.370 3.202 53.370 53.3702 1.811 30.188 83.558 1.811 30.188 83.5583 .486 8.107 91.6654 .415 6.912 98.5785 .085 1.422 100.000dimension06 4.846E-17 8.077E-16 100.000多元统计分析 II 类 A 卷 答题纸 第 6 页 共 10 页表2、Compo

13、nent Matrix aComponent1 2净利润增长率(%) -.663 .699营业总收入增长率(%) -.838 .458资产负债比率(%) .792 .340净利润(万元) .882 .417营业总收入(万元) .064 .888加权净资产收益率(%) .808 .188由以上结果说明在这个问题中保留两个主成分为宜,前两个的主成分集中了5个原始变量的84%的信息,可以达到较好的效果,即本问题使用两个主成分达到了降维的目的并对前面的公司进行分析。利用上表2的数据得到主成分量为: 6543211 80.6.082.79.083.6.0 XXXY 2 11459由此可以的到股票综合评价

14、函数为: 21%8.307.5YXF)(将前面的股票数据带入上式就能得到股票的综合得分和排名;表 3 综合排名排名 综合得分白云机场 1 -5827.51包钢股份 2 -2824.63宝钢股份 3 -54096.2东风汽车 4 -1004.64民生银行 5 -202882浦发银行 6 -206640四、研究结果及分析本文通过选取 20 家上市公司的股票在 2017 年第一季度的相关财务指标数据,在SPSS 中使用聚类分析和主成分分析对 20 家上市公司的股票进行一个完整的风险预测和选取比较有胜算的股票,通过研究将 20 家上市公司分为了 6 个类,第一类:白云机场、XD 中国过、上港集团、日照

15、港、浙能电力、上海机场、皖通高速、中原海能、山东钢铁,第二类:东风汽车、上海电力、首创股份,华能国际、华电国际、华夏银行,第三类:浦发银行,第四类:包钢股份、中原高速,第五类:宝钢股份,第六类:民生银行。选取了每个类主要的股票进行主成分分析得到综合评价和排名(1.白云机场 2.包钢股份 3.宝钢股份 4.东风汽车 5.民生银行 6.浦发银行) ,这个排名是 2017年第一季度的数据分析得来,对后面的投资有一定的参考性,同理如果我们对考虑投资的股票进行这个风险测评得到最好的投资目标,在一定程度上优化了投资,所以这多元统计分析 II 类 A 卷 答题纸第 7 页 共 10 页个聚类分析和主成分分析

16、的风险预测体系在股票市场上可以得到有效应用。附录股票代码公司名称净利润(万元) 净利润增长率(%)营业总收入(万元)营业总收入增长率(%)加权净资产收益率(%)资产负债比率(%) 600000浦发银行 1446200 3.8788 4236000 0.4006 3.96 93.4585600004白云机场 40784.7 17.4527 158374.75 8.5888 3.54 38.9311600006东风汽车 7031.14 -42.0401 383573.22 15.8487 1.08 64.8124600007XD 中国国 15865.7 -10.0239 60217.81 5.41

17、32 2.55 45.5434600008首创股份 10491.3 9.3495 176922.23 24.7694 1.1 66.9932600009上海机场 79142.4 23.4602 189516.19 15.7695 3.49 15.2116600010包钢股份 19768.6 135.9 1062954.72 95.9177 0.42 66.5382600011华能国际 65197.9 -86.9723 3757707.9 7.5373 0.89 75.2174600012皖通高速 29354.6 15.472 71667.28 5.8139 3.33 27.2382600015

18、华夏银行 449900 1.5346 1633100 8.0164 2.73 93.4838600016民生银行 1419900 3.597 3622900 -9.7299 16.71 93.8431600017 日照港 10733.3 34.8334 116399.04 5.6586 1.04 42.0456600018上港集团 114158 -6.3983 799251.82 12.4841 1.8624 40.12600019宝钢股份 378600 142.8817 8512234.85 76.7685 2.5 55.4288600020中原高速 45266.7 179.0118 212

19、087.58 139.313 4.95 74.2968600021上海电力 7322.74 -78.0356 446115.63 6.327 0.71 71.6062600022山东钢铁 45256.5 236.5 1648789.12 55.5363 2.7852 50.8156600023浙能电力 93482.3 -36.5284 1097199.44 35.1762 1.59 36.5729600026中原海能 56311.5 3.0687 266473.23 -38.754 2.03 52.8305600027 华电国 1183.6 -99.3492 1910904.3 13.3773 0.03 72.6487多元统计分析 II 类 A 卷 答题纸 第 8 页 共 10 页际多元统计分析 II 类 A 卷 答题纸第 9 页 共 10 页多元统计分析 II 类 A 卷 答题纸 第 10 页 共 10 页

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 金融证券 > 股票经典资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报