1、杭州电子科技大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。申请学位论文与资料若有不实之处,本人承担一切相关责任。论文作者签名: 日期: 年 月 日学位论文使用授权说明本人完全了解杭州电子科技大学关于保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属杭州电子科技大学。本人保证毕业离校后,发表论文或使用论文工作成果时署名单位仍然为杭州电子科技
2、大学。学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。(保密论文在解密后遵守此规定)论文作者签名:指导教师签名:日期:日期:年年月月日日杭州电子科技大学硕士学位论文基于协整分析的统计套利策略研究生:蔡志成指导教师:吕盛鸽 教授2013 年 11 月Dissertation Submitted to Hangzhou DianziUniversity for the Degree of MasterResearch on Statistical Arbitrage Strategiesbased on Cointe
3、gration AnalysisCandidate: Zhicheng CaiSupervisor: Prof. Shengge LvNovember,2013杭州电子科技大学硕士学位论文摘要2010年 3月 31日,融资融券试点正式推出;同年 4月 16日股指期货在中国金融期货交易所正式挂牌上市,获得社会各界广泛关注。融资融券业务推出和股指期货上市是中国证券市场发展的里程碑,标志着做空机制正式引入中国证券市场,使投资者在熊市中有规避风险的工具,同时使套利策略在国内有了生长的土壤。因此,对套利策略进行研究具有实际意义。本文从确定交易对象和交易时机两个方面研究统计套利策略。根据 2011年年报中
4、每股收益、净利润增长率等重要基本面因子对融资融券标的中权重最高的金融服务业股票进行聚类,以确定性质相似的股票构建股票池,用于下文筛选交易对象。利用 2010年 3月 31日至 2012年 4月 30日期间日收盘价(前复权)数据建模,以 2012年 5月 1日至 2013年10月 15日期间日收盘价测试相应策略收益情况。在确定套利策略交易对象方面,本文通过对股票池股票分别进行相关性分析、主成分分析和典型相关分析筛选出三对交易对象,利用协整检验确定三对交易对象存在协整关系,进而分别建立配对套利策略、主成分套利策略和典型相关套利策略,实证测试相应套利策略。结果表明,以上三种套利策略年化收益(%)分别
5、为 10.84、8.50和 9.98,日收益率与市场行情无关,且波动率显著小于同期沪深 300指数。在确定套利策略交易时机方面,本文在配对套利策略中分别引入格兰杰因果检验和GARCH模型:利用格兰杰因果检验确定股价间因果关系,根据模型预测值与股价实际值偏离情况指导交易;利用 GARCH模型刻画价差序列的波动性,以价差的时变标准差指导交易。实证测试基于格兰杰因果检验的配对套利策略和基于 GARCH模型的配对套利策略,结果表明,引入择时机制后两种策略日收益率的波动性、与市场行情相关性均下降,年化收益(%)分别为 6.80和 13.72。关键词:统计套利,协整分析,主成分分析,典型相关分析,格兰杰因
6、果检验,GARCH模型I杭州电子科技大学硕士学位论文ABSTRACTStock index futures and margin trading business are officially introduced to Chinas stockmarket in 2010. Their launch proved to be a milestone in the history of development of Chinasstock market, caught wide attention from all walks of life. Their launch signified t
7、he realization ofshort mechanism and the possibility of making profit in bear market. Therefore, stock indexfutures and margin trading business provide rich soil for the growth of arbitrage strategy andstudying arbitrage strategy has practical implication at present.In this article, we do research o
8、n statistical arbitrage strategy in two aspects to determinewhat to trade and when to trade. According to margin stocks fundamental factors in 2011 annualreport, we apply cluster analysis on financial service industry stocks to construct stock pool forfurther analysis. Then we use stock close price
9、from March.31th 2010 to April.30th 2012 to builttrading model and finally we test the trading model by using stock close price from May.1st 2012to October.15th 2013.In the part of determining what to trade, we use correlative analysis, principal componentanalysis and canonical correlation analysis t
10、o choose trading pairs, found their cointegrationrelationships, and then we build three trading systems. These three strategies have annual returnrates 10.84%, 8.50% and 9.98% separately. Their returns are stable and risk neutral.In the part of determining when to trade, we use GARCH model and Grang
11、er causality testto identify trading signals. Granger causality test finds the relations between stocks and makemodels, based on the spread between models predicted value and actual value to trade. Also, weuse GARCH model to track time varying volatility and trade. The Result shows that each methodh
12、as the annual return rate at 6.80 and 13.72. By using this timing mechanism, we can reducetrading strategy returns corelation with market, and make it more risk-neutral.Keywords: Statistical Arbitrage, Cointegration Analysis, Principal Component Analysis,Canonical Correlation Analysis, Granger causa
13、lity tests, GARCH modelII杭州电子科技大学硕士学位论文目录摘要.IABSTRACT . II目录 III1绪论 11.1选题背景及意义 11.2文献综述 21.2.1国内外研究现状 21.2.2文献综述小结 71.3本文结构安排 81.4本文创新之处 82统计套利相关理论 102.1统计套利和无风险套利 102.1.1统计套利的起源和定义 102.1.2无风险套利的定义 102.1.3统计套利和无风险套利的区别与联系 112.1.4统计套利策略常用方法 112.2协整理论与误差修正模型 122.2.1协整理论相关知识 122.2.2协整理论 132.2.3误差修正模型
14、142.3 ARCH模型和 GARCH模型 162.3.1 ARCH模型 162.3.2 GARCH模型. 172.4格兰杰因果检验 182.5聚类分析理论 182.5.1聚类分析的基本思想 182.5.2相似性的度量:距离 192.5.3系统聚类分析 202.5.4 K均值聚类分析 202.6主成分分析理论 21III杭州电子科技大学硕士学位论文2.6.1主成分分析的基本思想 212.6.2主成分分析的数学模型 212.7典型相关分析理论 222.7.1典型相关分析的基本思想 222.7.2典型相关分析的数学模型 223基于协整分析的统计套利策略 243.1基于聚类分析确定股票池 243.2
15、配对套利策略 283.2.1相关性分析 283.2.2平稳性检验 293.2.3协整检验 293.2.4误差修正模型 303.2.5配对套利策略实证分析 313.3主成分套利策略 343.3.1主成分分析 343.3.2相关性分析 353.3.3平稳性检验 363.3.4协整检验 373.3.5误差修正模型 383.3.6主成分套利策略实证分析 383.4典型相关套利策略 413.4.1 K均值聚类分析 413.4.2典型相关分析 413.4.3平稳性检验 433.4.4协整检验 443.4.5误差修正模型 443.4.6典型相关套利策略实证分析 454统计套利策略策略进阶 484.1基于格兰
16、杰因果检验的配对套利策略 484.1.1格兰杰因果检验 484.1.2平稳性检验 494.1.3协整检验 494.1.4误差修正模型 504.1.5基于格兰杰因果检验的配对套利策略实证分析 51IV杭州电子科技大学硕士学位论文4.2基于 GARCH模型的配对套利策略 534.2.1 ARCH-LM检验 544.2.2建立 GARCH模型 544.2.3基于 GARCH模型的配对套利策略实证分析 555研究总结与展望 585.1研究总结 585.2研究展望 58致谢 59参考文献 59附录 1. 62附录 2. 77V杭州电子科技大学硕士学位论文1绪论1.1选题背景及意义随着美国次贷危机逐渐平缓
17、,世界经济缓慢复苏,我国证券市场迎来了发展和创新的重要阶段。2010年 3月 31日,融资融券试点正式推出;同年 4月,股指期货在中金所正式上市。融资融券业务推出和股指期货上市是中国证券市场发展的里程碑,标志着做空机制正式引入中国证券市场,使投资者在熊市中有规避风险的工具,同时使套利策略在国内有了生长的土壤1。因此,对套利策略进行探讨具有实际意义。有别于无风险套利,统计套利是利用证券价格的历史统计规律进行套利的,是存在风险的,其风险在于这种历史统计规律在未来一段时间内是否继续存在。统计套利的主要思想是,通过数量化分析模型,确定受共同因素影响、价格波动相关性强的股票池,估算股票之间的长期均衡关系
18、,建立科学的交易规则,当某均衡关系被打破,价差偏离到一定程度时开仓,待价差回归均衡时平仓。自 2010年试点启动以来,融资融券业务在覆盖范围和市场容量上均得到长足发展。覆盖范围方面,2013年月 16日,上交所和深交所正式实施融资融券业务标的证券范围的第三次扩容,标的股票数量增加至 700余只,约占 A股市场约三分之一。市场容量发展则更为迅速,2012年融资融券余额为 884.92亿元,同比增长 131%,2013年 10月 18日,融资融券余额已经突破 3100亿元关口,达 3104.43亿元,较上年全年末增长 250.81%2。由于其内在的杠杆性,以及监管部门对开户条件、交易成本逐步降低,
19、融资融券业务使市场交投更活跃,深刻地影响市场各方。对券商而言,融资融券业务可以吸引更多的客户群体,提高佣金收入和利差收入3。以华泰证券为例,2013年上半年实现营业收入 36.36亿元,融资融券业务收入 7.42亿元,比上年同期增长 162.63%,占营业收入的比例由 8.33%提高至 20.41%。对投资者而言,融资融券业务提供杠杆投资工具,并使其在熊市中通过融券卖出而盈利成为可能。2013年 9月,融资融券信用账户总数达 223.76万,较上年同期增长 187.91%,可见投资者对融资融券需求之大4。随着客户覆盖范围进一步拓宽、结构日趋合理,融资融券业务已成为投资者重要的基础性交易方式。股
20、指期货于 2010年 4月 16日在中金所正式上市,获得社会各界广泛关注。考察交易金额,上市首月股指期货累计交易金额已经超过 A股市场同月累计交易金额5。目前,股指期货占期货市场半壁江山,据中国期货业协会公布数据显1杭州电子科技大学硕士学位论文示,2013年 1月至 9月全国期货市场共成交 206.23万亿,其中股指期货占49.79%6。目前,四大期货交易所正在积极推进各种期货和期权上市,如股指期权、国债期货和白糖期权等品种已处于仿真运行阶段,运行状况良好;外汇期货、商品指数期货和中小板指数期货等仍在研发阶段。股票市场方面,监管层正在研究大蓝筹股 T+0交易的可行性, T+0交易的推出受市场各
21、方的热烈关注。可以预期,随着新品种的上市、交易方式的创新,做空机制将有更巨大的发展空间,投资者将获得更多风险管理手段和资本增值机会,由此分享经济发展的成果。做空机制出现在国内仅有三年多历史,国内学术界关于统计套利的探索较少,主要停留在理论的层面。随着 T+0交易、期货和期权的陆续推出,统计套利的应用将有更广阔的发展空间。本文的研究重点是统计套利在市场的实际应用,在全面介绍统计套利相关理论及相关数学模型的基础上,开发简易可行的交易策略,提供市场参与者作参考范例。1.2文献综述受制于国内 T+1的交易制度,统计套利策略缺乏实践基础,国内对其理论研究相对滞后。在国外,统计套利并非金融学最新理论研究成
22、果,相应的交易策略已被投行、券商和对冲基金广泛应用。1.2.1国内外研究现状在统计套利交易过程中,需要确定交易对象和交易时机。因此,学术界围绕这两点进行了广泛研究。确定交易对象时,常用的方法是协整分析理论。最早在统计套利策略中引入协整分析思想的是 Sutcliffe和 Board(1996)等人。在他们的研究中,首次对芝加哥期货交易所、大阪证券交易所以及新加坡交易所三地上市的日经 225指数期货进行协整分析,发现相互存在协整关系,其实证结果进一步指出跨市场统计套利机会的存在7。Burgess(1999)在基于协整分析的统计套利研究中创新性的对交易对象建立误差修正模型以确定套利对冲比例,并利用英
23、国富时 100指数 1996年 6月 13日至 1998年 5月 13日的日收盘价为数据进行实证分析,考虑交易成本后套利模型中仍有 67%的收益率8。Alexander和 Dimitriu(2004)在传统的指数跟踪投资组合中分别引入协整分析方法和误差跟踪方法,构建两种统计套利策略。他们的研究表明,基于协整分析的统计套利策略能获得稳定的、市场中性的收益,收益率近似服从于正态分布,协整分析方法显著优于误差跟踪方法9。Brian Jacobsen(2008)、杨怀东 (2011)、甘露(2012)等基于日内高频交易数据的2杭州电子科技大学硕士学位论文协整关系将误差修正模型应用到统计策略,交易方法简
24、单而且取得了不错的投资收益,便于一般投资者实施套利10,11。仇中群和程希骏(2008) 、王云平(2011) 等通过在股票市场和股指期货市场的实证研究,发现基于协整的统计套利策略能捕捉到更多的交易机会,套利策略的风险收敛。比较其他的误差跟踪方法,协整分析方法效率更高,收益率与市场相关性更小12,13。基于主成分分析确定交易对象,是另一种常用方法。Burgess(1996)首次在统计套利策略中引入主成分分析方法,通过主成分分析构建欧洲美元的投资组合,结合神经网络分析方法研究交易策略,结果表明策略收益是可预测的14。Marco Avellaneda和 Jeong-Hyun Lee(2008)等利
25、用主成分分析方法研究统计套利策略,并对比 ETF法进行回溯测试。研究结果表明,基于主成分分析的统计套利策略年化夏普率比基于 ETF法的统计套利策略更高,基于主成分分析的统计套利策略效果显著比 ETF法更好15。套利策略关注的是对冲后的价差序列,而不是交易标的本身的价格序列,因此在确定交易时机方面,研究主要集中于利用不同的计量经济模型刻画价差序列。徐光梅(2008) ,康瑞强(2009),李世伟(2011),刘丛瑜(2011) 引入 ARCH、GARCH等时变波动模型刻画价差序列,根据样本内数据分别使用 Var方法、非参数化方法、Lasso算法、敏感性分析以及 Monte Carlo模拟等方法确
26、定阈值以建立统计套利策略,在样本外对股指期货和商品期货进行实证研究,结果表明,ARCH、GARCH等模型比基于样本内常数标准差套利策略捕捉到更多的交易机会,其收益稳定性更好,风险调整收益更高。但以上研究同时表明,ARCH、GARCH模型忽略了价差序列分布非对称、有偏的特征,可以考虑使用其它非线性或非对称的事变波动模型,如:QGARCH模型、GJR模型、GARCH-M模型、TGARCH模型、EGARCH模型等16,17。Elliot,VannerHoek,Maleolm(2004),刘海燕(2011)等研究表明,若价差序列存在均值回复的性质,则可通过 O-U过程刻画价差序列18。William
27、K.Bertram(2010)以年化收益最大化和年化夏普比率最大化为目标函数,根据给定交易频率,分别求出最优化交易信号的理论表达式,研究进一步求出当价差序列服从 O-U过程时交易信号最优解的表达式;任吉卫(2012)继承了上述研究的思想,根据年化收益率、年化夏普比率衡量套利策略的效果,其研究指出:以 O-U模型刻画价差序列,优于其他非参数化分析的方法。最后,作者提出几点建议:在套利策略中结合多种模型进行分析、及时更新交易信号和止损信号、采用窗口滚动法和记忆周期等理论而非固定窗口法19。3杭州电子科技大学硕士学位论文颜涵(2012)采用三种方法刻画高频数据的价差序列波动性特征:最小二乘回归、GA
28、RCH模型以及 O-U过程,进而使用年化夏普比率、年化收益率和年化K-Ratio指标综合的衡量套利策略绩效。结果表明,采用 O-U过程指导套利优于其他两种模型,但研究中未考虑协整突变、分析周期较短等问题20。陈守东(2007) 使用逐步回归法确定套利对象,利用方差比分析检验价差可预测性,验证协整关系后建立统计套利模型。研究表明,采用逐步回归法有助于发现股票市场的统计套利机会,并可提高投资组合的年化夏普比率21。Giovanni Montana,Kostas Triantafyllopoulos,Theodoros Tsagaris(2009)等针对标准普尔 500指数的股指期货合约,采用灵活最
29、小二乘法算法建立套利交易系统,并从理论上证明:灵活最小二乘法与卡尔曼滤波方程之间存在对应的关系。该研究中,采用降维分解的方法对数据增量奇异值进行处理,并分别对包含增量奇异值的灵活最小二乘法交易系统、不包含增量奇异值的灵活最小二乘法交易系统以及简单的买入-持有交易策略绩效进行了综合比较分析。交易系统测试结果表明,对比简单的买入-持有交易策略,采用灵活最小二乘法的交易系统显著更优,获得年化收益率更高,收益的稳定性更好。最后得出结论:具有时变系数的灵活最小二乘算法是实用时态数据挖掘工具,比普通最小二乘法更好的反映价差变化趋势22。Christian L.Dunis,Gianluigi Giorgio
30、ni(2010)等分别建立协整模型、滚动最小二乘法波动模型、双指数平滑预测模型以及卡尔曼滤波模型,对欧元区斯托克 50指数成分股交易数据进行实证分析。研究表明,结合高频数据的协整模型表现比其他模型更好。作者建议在套利策略中结合以上模型,而非使用单一模型,如建立基于时变参数的卡尔曼滤波模型23。杨怀东,潘珺(2012) 等以股指期货一分钟的高频数据为样本,分别测试基于协整模型、卡尔曼滤波模型以及将两个模型结合的套利策略。研究表明,将两个模型结合的套利策略效果比单一模型的套利策略好,收益的波动性更小,年化夏普率更高,能够更好的做到市场中性24。Antonia Azzini和 Andrea G. B
31、. Tettamanzi(2006)在国际演化计算会议上发表了分别关于神经网络结构和权重优化的研究,利用神经网络模型内在的反向传播特性作为解码器,确定序列间相互作用的因素。结果表明,使用该方法建立套利策略能获得较好的效果25。Nikos S.Thomaidis,Nick Kondakis and George D.Dounias(2006)等在协整模型中引入神经网络算法,使统计套利系统具有遗传进化的性质,从而解决了交易对象价格偏离的动态相关性问题。文章最后实证测试了该套利系统的年化收益、平均盈亏比和最大回撤等指标,实证表明交易系统能较好免疫风险26。4K.Trianktafyllopoulos
32、G.Montana(2009)通过结合时变状态空间模型和贝叶斯杭州电子科技大学硕士学位论文崔建福、李兴绪(2004) ,陶庆梅(2005) ,张虹(2007) 在传统线性的 GARCH模型中引入神经网络,根据该模型对沪深 300股指期货和股票价格进行预测。他们的研究成果表明,结合 GARCH模型和神经网络进行预测,能获得比其他传统线性模型更精确可靠的预测值27,28。方法建立了贝叶斯时变自回归模型,利用该模型动态预测了价差序列的均值回归过程。实证结果表明,贝叶斯时变自回归模型能较好的刻画价差序列均值回归的变化过程29。唐琳(2010)根据对数似然函数确定模型形式,利用贝叶斯方法和蒙特卡洛方法估
33、算模型参数、隐含变量的后验分布密度函数。通过对比发现,该策略估算出的随机波动模型比 ARCH、GARCH等线性时变波动模型更能反映金融时间序列的异方差性质,模型拟合效果更好30。Philip Saks和 Dietmar Maringer(2008)等分别使用单树结构和双树结构确定交易规则,并在建立统计套利策略时引入遗传算法的思想。研究发现,单树结构和双树结构都能很好的捕捉到交易时机,且遗传算法能有效提高统计套利策略表现。但该研究未考虑到交易成本,其实用性仍需进一步考证31。Janice How,Martin Ling,Peter Verhoeven(2010)等根据遗传算法理论框架的研究思路建
34、立套利策略,并通过实证进行分析。研究结果表明,在考虑交易成本的情况下,在不同的时期内大部分基于遗传算法的套利策略比简单的买入-持有策略效果更好。根据数据的模拟,该套利策略都取得了正的收益。文章最后提出了对该策略的进一步研究的方向建议32。来升强(2009) 在其博士学位论文中提出了针对投资者不同动机的交易策略:基于遗传算法的交易策略。该策略将众多不同的技术分析指标整合,利用遗传算法以滚动窗口不断迭代求解出最优解,从而使交易策略进化。文中还对单一技术指标和多个技术指标整合的时效性进行了分析;基于协整关系的交易策略。研究表明,通过协整分析筛选得到的交易对象比不存在协整关系的交易对象套利效果更好。另
35、外,该研究也表明,套利策略收益主要源于价差序列的波动;基于卡尔曼滤波的微观交易模型。根据相对风险理论,该策略将配对套利模型纳入了无套利定价理论的框架中。在研究投资组合的构建方面,文章根据状态空间模型估计的参数显著性来确定配对交易对象。文中使用的估计方法包括滑动估计、滚动窗口估计,以逐日推进的方式不断更新,从而避免了数据周期、数据长度选择的问题,更得到接近现实的收益分布。最后,作者从无风险收益、资本资产定价模型理论的角度,分析市场收益率构成并指出微观交易策略的本质。根据前文的理论,通过构建数量分析模型建立微观交易策略,对实证分析得到的策略年化5杭州电子科技大学硕士学位论文收益率和市场年化收益率进
36、行了比较分析33。Cathy Ning(2010)使用 Copula方法分析证券市场和外汇市场的相关结构和联动性,使用 ARCH、GARCH和 SV等模型刻画金融序列的肥尾尖峰、偏斜和异方差等性质,模型的预测效果良好。将时变波动率模型和 Copula模型有机结合,研究证券市场和外汇市场的相关性,是 Copula方法应用的一个创新34。张戈(2011)使用 Coupla函数对我国股指期货一分钟频率和五分钟频率的高频交易数据研究统计套利策略,通过 Coupla函数拟合了价格序列之间非线性的相关关系,根据成功率数学期望确定交易时机。研究表明,基于 Coupla函数的统计套利策略可获得较高的年化收益率
37、,策略收益波动性小,可操作性强35。李璁(2011)在 SV-t模型中引入 Coupla方法,构建 Copula-SV-t模型对统计套利策略进行研究。以沪深 300股指期货和沪深 300股票指数为交易对象,构建期现套利策略。研究表明,引入 Copula函数可以获得提高的投资收益。但是实证分析中未考虑佣金、印花税等交易成本,实证的可靠性值得商榷36。Andrew Pole(2007)在其研究中回顾了统计套利的起源和发展现状,指出统计套利的主要特性和有效前提,并详细讨论了时变波动率模型、动态线性模型和自回归协整关系模型等复杂动态因子时间序列模型。最后介绍突变理论、动量反转理论、爆米花理论等,对统计
38、套利策略发展中存在的问题、未来的发展方向和原因进行了理性的分析37。Robert Jarrow,Melvyn Teo,Yiu Kuen Tse,Mitch Warachka(2011)等研究发现,当市场摩擦可控、价差收敛速度可测时,采用动量套利策略和价值套利策略能够捕捉到可靠的交易机会,从而提高策略收益率38。张连华,朱平芳,韩清,杜才鸣(2011)等利用在线支持向量回归算法对我国的沪深 300股指期货建立套利策略。实证表明,对比基于协整分析的统计套利策略,基于在线支持向量回归算法的套利策略能有效提高交易信号的可靠性,减少虚假信号,从而提高年化收益率39。柳慰颖,陈以增,毛亚莉(2012)等在
39、基于协整分析的统计套利策略中引入EWMA模型,对历史数据赋予较大权重,当前数据赋予较小权重以更新价差序列均值的走势,从而能较好的拟合价差中枢;通过样本内标准差和 EWMA模型建立交易规则,测试交易模型在股指期货间日收盘价的跨期套利效果。该研究表明,引入 EWMA模型能提高套利策略的成功率且能获取较高的实际收益,但研究中为考虑波动率时变性、交易成本等因素40。在实务界方面,随着融资融券业务发展,我国各大证券、期货公司推出了一系列统计套利的研究报告。2008年光大证券发表一系列对冲基金策略专题报告,其中对冲基金的股票市场中性策略提出了股票市场中性的概念,其基本思想6杭州电子科技大学硕士学位论文是同
40、时买入和卖空股票以对冲市场风险,以期获得稳定收益。该报告还提出股票市场中性的多种投资策略都有共同的特点:市场风险中性,即贝塔中性。该报告认为有效的股票市场中性策略产生的收益会超过无风险利率水平,这种收益并不取决于整体市场走势,而是依靠投资者的选股能力41。招商证券在 2008年推出融资融券专题研究报告系列,对融资融券的业务模式及其影响,融资融券业务的交易策略都做了较为系统的研究。其中基于随机选择的配对交易策略提出市场中性策略可以分为贝塔中性策略、巿值中性策略和因子中性策略。该片报告的选股方法是通过对证券的交易价格进行累积收益标准化处理之后,随机选择历史累计收益价差最小的证券组合进行配对交易42
41、。浙商证券在 2010年推出融资融券与统计套利专题研究系列,采用各种计量模型刻画对冲后的价差序列,如正态分布、自回归和均值回复等,并测试基于以上模型的套利策略。另外,在其报告中提出了主成分套利思想,直接利用原始股价信息提取主成分,将成分股股价表示为主成分函数,利用股价对主成分组合的偏离和回归进行套利,获得稳定且独立于市场的收益43。中信证券 2010年金融工程策略报告中,构建短期均值回归模型、短期交易活性模型和分析师盈利预测模型对统计套利策略在我国 A股市场的应用进行了探讨。三个模型是基于相同的基本原理,但交易对象选择思路不同:在短期均值回归模型中,做多近期表现弱的股票同时做空近期表现强的股票
42、;在短期交易活性模型中,做多近期换手率低的股票同时做空近期选手率高的股票;在分析师盈利预测模型中,做多分析师调高盈利预测的股票同时做空分析师调低盈利预测的股票。实证结果表明以上统计套利策略都可以获得持续稳定的收益,但是该文并未对这三种模型进行绩效评价44。1.2.2文献综述小结国内外学者在统计套利上所做研究,均有一定的理论依据和实证方面的创新之处,总结以上研究成果,本人得出以下两点结论:在确定交易对象方面,最常用的方法是协整分析。基于协整的套利策略基本思路是,根据一定原则确定股票池,从中筛选具有协整关系的股票进行配对,建立误差修正模型计算价差序列,求出价差序列的合理范围,若发生异常波动则进行套
43、利;基于主成分分析的套利策略基本思路与上述类似,区别在于,确定交易对象时考虑个股与一组股票。但以上两种分析方法都可能由于个股收购、并购等重大突发事件使价格剧烈波动,价差序列长期偏离正常水平使得套利策略失效。在确定交易时机方面,引入GARCH模型、均值回归过程、 Copula函数和神经网络等计量方法。这类模型的形式和估计复杂,而研究中通常分析同一时期交7杭州电子科技大学硕士学位论文易对象的价差序列,在实际交易中难以实现,从而导致研究的策略绩效大打折扣。1.3本文结构安排本文共五章,各章节主要内容简介如下:第一章:绪论,介绍选题背景和意义、文献综述、本文章节安排和研究的创新之处。第二章:理论部分,
44、详细论述统计套利相关理论。具体包括统计套利和无风险套利、协整理论和误差修正模型、ARCH和 GARCH模型、格兰杰因果检验、聚类分析理论、主成分分析理论和典型相关分析理论等。第三章:实证部分,展示基于不同方法确定交易对象的统计套利策略。由于融资融券的股票达 700多个,因此利用聚类分析对融资融券标的基本面因子进行聚类,确定数目较少且基本面相近的股票池;配对套利的基本思路是,在以上股票池,寻找各股票间存在的协整关系两两配对,若两只个股协整则建立误差修正模型确定配对交易的比例,根据该比例获得价差序列,利用价差序列的波动产生交易信号进行套利;主成分套利是配对套利的推广,利用主成分分析理论确定由一组股
45、票构成的主成分,通过相关系数的大小筛选个股和主成分进行配对,并检验是否具有协整关系,若存在则建立误差修正模型,根据价差序列进行套利。本质上,主成分套利将配对套利中交易对象“一对一” 推广至“一对多”;最后,尝试引入典型相关套利,其基本思想与主成分套利是一致的,将交易对象进一步推广至两组股票,即根据两个股票组合之间价差序列进行套利。第四章:实证部分,展示根据不同计量模型确定交易时机的统计套利策略。第一节,尝试利用格兰杰因果检验确定交易对象不同时期的因果关系,根据该因果关系采用逐步回归法建立预测模型,检验模型预测值与实际值是否存在协整关系,若存在则建立误差修正模型,求出价差序列进行套利。第二节,在
46、配对套利策略中并引入 GARCH模型刻画价差波动的聚集性,从而捕捉更多交易机会。第五章:结论和展望,根据本文研究进行总结归纳,并展望统计套利未来的发展趋势。1.4本文创新之处针对目前国内外研究现状,本文的创新点体现在以下三个方面:基于聚类分析确定股票池;利用典型相关分析确定交易对象;利用格兰杰因果检验确定交易时机。(1)本文引用聚类分析,尝试根据基本面因子对股票进行聚类,得出基本面相似的股票池,寻找可信度更高的协整关系。对股票池的确定,目前国内外研究中常见的方法是,主观的选择同一行业的个股,验证两两是否具有协整关系。本文认为,单纯按行业划分选取配对股票是低效的,不能保证选出股票具有协整关8杭州
47、电子科技大学硕士学位论文系,且行业内部个股数量一般达数十乃至上百只,基本面因子差异必然很大,而价格走势最终仅受基本面因子影响,因此长期均衡被打破的概率高。(2)本文利用典型相关分析,将个股配对推广至股票组合的配对。在确定交易对象时,目前常用协整分析和主成分分析。典型相关变量是多只股票的线性组合,对非系统性风险的敏感程度低,受个股影响较小,因此利用典型相关分析确定的股票组合之间协整关系将更稳定。(3)本文引入格兰杰因果检验,根据实际值与模型预测值的偏离确定交易时机。9(3) lim Pvt 0 0 ;(4) 对 t 若 Pvt 0 0,则有 lim杭州电子科技大学硕士学位论文2统计套利相关理论2
48、.1统计套利和无风险套利2.1.1统计套利的起源和定义统计套利的雏形出现在 20世纪 20年代,当时华尔街的传奇人物 JesseLivermore提出并列交易法,即跟踪相关性高的股票,根据相对行情进行交易。Jesse Livermore的并列交易法体现了统计套利的基本思想:寻找长期均衡关系,根据短期的异常偏离指导交易。得益于科技发展,20世纪 80年代 Morgan Stanley的 Tartaglia团队开发出基于机器计算的统计套利策略并在交易中获得巨大成功,随后团队成员陆续供职于其他公司,统计套利策略得到进一步推广和发展。统计套利的应用已有较长历史,但其严格的数学定义在 2003年才由Bo
49、ndarenko Oleg给出,随后不同学者对其深化拓展,其中 S.Hogan(2004)等人对统计套利的数学定义得到广泛认可:自融资交易策略在时刻 t的现值为 v(t),若v(t)满足:(1) v(0) 0;(2) lim Ev(t ) 0;tttVarvtt 0。则称该交易策略为统计套利策略。上述定义中,四个条件的经济意义分别是:(1)策略初始投入为 0;(2)若时刻 t充分大,策略现值 v(t)数学期望为正;(3)若时刻 t充分大,策略亏损概率为 0;(4)若策略在任意有限时刻发生亏损,则在时刻 t充分大时,现值方差 varv(t)的时间平均随时间增长趋于 0,即随着时间推移,发生亏损的概率为 0,现值方差以小于线性增长速度随时间增长。2.1.2无风险套利的定义对比统计套利,无风险套利的定义为:自融资交易策略在时刻 t的现值为 v(t),对任意 t0、向量 使得 X t I (d b),则称 X t分量序列存在(d,b )阶协整关系,记为 X t CI (d