1、实验二 虚拟变量在金融数据处理中的作用一、实验目的:了解虚拟变量、方差分析模型、协方差分析模型、虚拟变量陷阱、季节调整、分段线性回归、级差截距、级差斜率系数、周内效应等基本概念及虚拟变量的引入原则、虚拟变量模型中参数的意思。掌握虚拟变量模型在回归分析中的应用,及如何在 Eviews 中实现相应的操作。二、基本概念:由于其不能直接度量,为研究方便,可构造一个变量,令其取值为 1 或为 0,取值为0 时表示某一性质出现(不出现) ,取值为 1 时表示某性质不出现(出现) ,该变量即为虚拟变量(dummy variables),也称指标变量(indicator variables) 、二值变量(bi
2、nary variables) 、定性变量( qualitative variables)和二分变量( dichotomous variables),通常我们记为 D。一般的,在虚拟变量的设置中,基础类型、否定类型取值为“0” ,称为基底(base)类、基准(benchmark)类或参考(reference)类;而比较类型、肯定类型取值“1”。许多按月度或季度数据表示的金融时间序列,常呈现出季节变化的规律性,如公司销售额、通货膨胀率、节假日储蓄额等。在研究中,有时需要消除季节性因素的影响,即需要进行季节调整(seasonal adjustment) ,利用虚拟变量进行季节调整是较为简单的一种。
3、另外,在金融理论中,常常会出现一种情况:当某影响因素越过某一临界值,或时间过了某一临界点之后,因变量对影响因素的变化率将发生变化,在图形中就表现为斜率不同的两段连续折线,利用虚拟变量模型进行分段线性回归可有效地解决在分界点处两边因变量取值不相等,与理论图形不一致这个问题。三、实验内容及要求:内容:我们利用上海股票市场上证指数 1997 年 1 月 1 日到 2004 年 12 月 31 日的日收盘价数据,共 1926 个观测值,通过建立虚拟变量模型来检验实行涨跌停板制度后的上海股票市场是否存在周内效应。要求:(1)深刻理解上述基本概念(2)思考:虚拟变量模型的各种不同运用情形,及虚拟变量法与邹
4、式检验的异同(3)熟练掌握相关 Eviews 操作(4)根据教材(表 4-4)即我国 1994 第一季度2004 第四季度的零售物价指数(以上年同期为 100)数据,请利用虚拟变量模型进行季节调整(如果需要) 。四、实验指导:1.简单理论回顾根据 Fama 的有效市场理论,在有效市场中,由于股票价格能够及时地反映所有的信息,因此股价将会呈现出随机波动的特征。并且在有效市场中,由于投资者能够随时获取所需要的信息,因此将不存在套利的机会,股票的价格将反映价值。按照有效市场理论,一周内每天的收益率将是随机波动、没有规律的。自从 Fama1965 年提出有效市场概念以来,各国学者分别利用各国的证券市场
5、数据对其进行了实证检验,结果发现许多与有效市场理论相背离的现象,周内效应就是其中之一。在我国,许多学者也利用上海股票市场、深圳股票市场的数据对周内效应进行了检验,检验结果大多表明存在周内效应。下面我们将利用虚拟变量模型对这一现象进行实证检验。2.实证检验(1)数据说明我们利用的是上海股票市场上证指数 1997 年 1 月 1 日到 2004 年 12 月 31 日的日收盘价数据,共 1926 个观测值。之所以采用 1997 年来的日数据,是因为 1996 年 12 月 16 日股票市场实施了涨跌停板制度,而上证指数也具有广泛的代表性。收益率的计算我们采用的是连续收益率法,计算公式如下:,其中
6、为 t 时期的收盘价, 为 t-1 时期的收盘价。ttt-1R=lnPt-1P(2)数据导入打开 Eviews 软件,选择“File”菜单中的“New-Workfile”选项,出现“Workfile Range”对话框,在 “Workfile frequency”框中选择“Undated or irregular”,在“Start observation”和“End observation”框中分别输入“1”和“1926” ,单击“OK” ,出现一个新的工作文件。然后选择“File”菜单中的“Import-Read Text-Lotus-Excel”选项,找到要导入的名为EX4.3.xls 的
7、 Excel 文档,单击 “打开”出现“Excel Spreadsheet Import”对话框并在其中输入“D1” “D2”“D4”“D5”和“R”,如下图所示:图 21 数据导入再单击“OK”完成数据导入。(3)数据统计特征描述下面分别描述上证指数 1997.1.1-2004.12.31 日收益率(R)的统计特征以及日收益率按时间排列的序列图,具体操作如下:首先双击“r”序列,出现如下窗口:图 22 序列 R 的统计数据其次选择“Series: R”窗口的“View”菜单中的“Descriptive Statistic-histogram and stats”选项,可以得到日收益率( R)
8、的统计特征图:图 23 日收益率(R)的统计特征图即(表 4-1) 上证指数日收益率统计特征描述均值 0.000166 中位数 0.000209最大值 0.094010 最小值 -0.093350标准差 0.015415 偏度 -0.039554峰度 8.998717 Jarque-Bera 值 2886.767再选择“Series: R”窗口的“View”菜单中的“Line Graph”选项,可得到日收益率线性图:图 24 日收益率(R)的线性图(4)回归数据估计方程我们建立如下的虚拟变量模型:t01t2t34t5ttR=+D+D+其中 表示 t 时刻的收益率,虚拟变量 (i=1,2,4,5
9、)的取值在每周的第 i 天(一周t it五天)取值为 1,其余时刻取值为 0。从模型可以看到, 表示的是周三的平均收益,0而 分别表示的是星期一、星期二、星期四、星期五与星期三平均收2 34、 、 、益的差异。若差异是显著的,则可以表明上海股票市场存在周内效应。使用 Eviews3.1 软件对上述模型进行 OLS 回归,具体操作如下:在 Eviews 命令窗口中输入“LS R C D1 D2 D4 D5”并回车,得到如下结果:图 25 虚拟变量模型回归结果即:(括号内为相应的 t 值)t 1t 2t 4t 5t R=0.17-.049D-.0793-.0198D-.0() (35) () (.7) ()对模型各系数估计值进行联合 F 检验,看各系数值是否同时为零,结果的到 F 值为1.03,其概率值为 0.39,因此不能拒绝各系数值同时为零的假设,则可以得出结论,上海股票市场不存在周内效应。实际上,这个模型是相当粗糙的,因此结论也可能不具有代表性。因为在使用最小二乘法进行回归时,我们假定随机误差项满足同方差的假定,但大量的研究表明,金融数据中这一假定往往不能得到满足。更深入的研究涉及到自回归条件异方差模型(ARCH)以及扩展的自回归条件异方差模型(GARCH) ,我们将在后面的章节中予以介绍,有兴趣的同学那时也可以重新对上海股票市场的周内效应做出检验。