1、资本资产定价模型的横截面回归(两步回归)一、理论背景基于夏普的基本资本资产定价模型(CAPM):1.理论模型1fMifi RER其中 为资产 的收益率, 为无风险利率, 为市场证券组合的收益i f MR率, 为资产 对市场风险的敏感度,即市场的收益每变动一个单位,资产 的i i收益变动多少,也称作风险值(BETA) 。模型表达:资产 的期望超额收益等i于市场组合期望超额收益乘以资产 的的风险值。i理论模型无法验证,因此要依据它写出能实际验证,即能进行统计检验的模型。2.统计模型对每个资产 的时间序列,有itfMiifi RR我们实验采用的是 的简化式0f2tMiiia对横截面(资产 间) ,有
2、3iit uR其中 为风险溢价。验证的内容即:如果理论模型 1 式成立,则统计模型 3 式中的 , 0。 通过统计实证来验证,首先回归估计 3 式的常数 和 ,然后检验他0 们。如果 和 是统计显著的,则实证支持理论成立;反之实证不支持0理论。二、实验步骤(一)搜集、整理数据收集并整理出 30 以上股票的收益率时间序列(必须包括上证综合指数,即000001.ss) ,时间长度 2002-7-1 至 2009.实验课做法总结如下:1)选股票:建议从我提供的 2000 年前上市公司代码表抽样选取 50 只股票代码,然后小组成员均分。到中文或英文雅虎搜历史价格时间序列。2)以 000001.ss 为
3、基准,对齐个股的历史价格,使每行数据都是同一时间的观测。3)构成合格的价格时间序列,然后通过对数差分转化成收益率时间序列表。(二)时间序列回归(第一步回归) ,即计算每个资产的 BETA,30 几个股票样本,则算 30 几个 BETA.滚动样本计算,即计算每个股票滚动样本的BETA 序列.1.时间序列回归对模型 2 式做 tMiiiRa因变量数据: 的时间序列;自变量数据: 的时间序列。用函数 slopei MR估计 BETA,即 。i2.计算 , 为样本时间序列的数据个数。TtitR13滚动样本我们不是用整个搜集来的时间序列做一次时间序列回归,而是按 1 至100,1 至 101,,1 至最
4、后一个时间序列数据,分别作多次时间序列回归。即滚动样本,对每个滚动样本都做一次。(三)横截面回归(第二步回归)对模型 3 式做, iit uR因变量 是(二)中算出来的,自变量 也是(二)中算出来的。ols 回t i归估计 和 ,并检验它们(t 检验法)是否显著。 为风险价格,也就是定价因子。如果估计出个股的 BETA 值,那么 乘以 BETA 就是个股的定价。附录:1认识时间序列和横截面数据。时间序列回归,即用变量的时间序列数据做回归;横截面回归即用变量的横截面数据做回归。变量的数据可按行放也可按列放,下图数据矩阵,列是个股的时间序列,行是收益率的横截面数据,即收益率在不同公司的观测。2.上
5、述数据表的代号表示 NTTR 11公 司公 司 一时 间 标 号其中任一单元格的值标号为 ,我们用 R 表示受益率的意思,脚标 表示it i公司的序号从 1 到 N,我们说 N 个公司或 N 个资产; 表示时间标号,从 1 取到tT,其代表自然的日期时间,即把年月日的时间表示记成自然数值的顺序值。对做时间维的加总,可简单记为 ,这是为求平均收益率,这样的家中有itRTti1N 个,因为 可取 1 到 N.i我们把数据看成时间序列样本,即已列一个变量数据,共 N 个,一个公司一个;我们把数据看成横截面数据样本,即一行一个变量数据,共 T 个,在不同时间对不同公司的收益率观测。3.滚动样本,按时间滚动。认为从全样本(所有数据行和列)构造多个子样本,为的是分别用它们回归估计出多个平均收益率和多个 BETA.如果子样本有 1500 个,则得到 1500 行平均收益率横截面数据,1500 行时间序列回归(SOLOPE 算的)估计出来的 BETA 横截面数据。横截面回归可重复 1500 次。第一个为10,10, NR 公 司公 司 一时 间 标 号第二个 10,10, NR 公 司公 司 一时 间 标 号最后一个 NTTR 11公 司公 司 一时 间 标 号?清楚两步回归中的时间序列回归和横截面回归了吗?清楚滚动样本了吗?会用 EXCEL 做吗?