收藏 分享(赏)

网络媒体对股票市场的影响_以东方财富网股吧为例的实证研究_金雪军.pdf

上传人:精品资料 文档编号:10880533 上传时间:2020-01-17 格式:PDF 页数:17 大小:3.48MB
下载 相关 举报
网络媒体对股票市场的影响_以东方财富网股吧为例的实证研究_金雪军.pdf_第1页
第1页 / 共17页
网络媒体对股票市场的影响_以东方财富网股吧为例的实证研究_金雪军.pdf_第2页
第2页 / 共17页
网络媒体对股票市场的影响_以东方财富网股吧为例的实证研究_金雪军.pdf_第3页
第3页 / 共17页
网络媒体对股票市场的影响_以东方财富网股吧为例的实证研究_金雪军.pdf_第4页
第4页 / 共17页
网络媒体对股票市场的影响_以东方财富网股吧为例的实证研究_金雪军.pdf_第5页
第5页 / 共17页
点击查看更多>>
资源描述

1、网络媒体对股票市场的影响以东方财富 网股吧为例的实证研究金雪军祝 宇 杨晓兰内容提要 中小投资者在股票论坛 的讨论是否会对股票 的收益率 与 成交量产 生影响 ?为 了 回答这一问题 , 本文抓取了 中 国最大的股票论坛在 年 月 至 年 月 期间共 万条发帖数据。 借助文本挖掘技术 , 我们提取发帖 中蕴含的投资者意见 , 并在此基础上建立 了看涨指数以及意见趋 同指数。 通过考察这两个指数与股票价格、 成交量的关系 , 我们发现 : 第一, 看涨指数 与股票收益率呈正向相关 , 且看涨指数对第二天的收益率具有预测作用 , 但由 于股票论坛的发帖更新十分迅速 , 滞后 多期的看涨指数对收益率

2、的影响在统计上则并不显著 ; 第二 , 意见趋同 指数影响成 交量 , 意见趋同程度越低 , 股票的交易量越大 ; 第三 , 论坛发帖量对股票成 交量有着显著 的正 向影响 。 随着信息技术的不断发展 , 网络媒体对股票市场产 生的影响将 日 益凸 显 , 如何加强股票市场信息披露、 规范网络信息管理是金融监管 当局亟待解决的一个重要问题。关键词 网络媒体 股票市场文本挖掘在互联网时代背景下 ,众多现实案例和理论研究表明网络舆论不仅在公共事件中扮演了重要角色, 其影响力甚至扩展到了金融市场 , 网络传闻导致上市公司股价暴涨暴跌的事件时有发生。 例如 年第一季度 , 南风化工 (股票代码 已预计

3、公司 年度将亏损 亿元左右 , 但是由于某网络论坛上有传闻称其正在研发“世界上最薄最坚硬的纳米材料”石墨烯 , 导致该公司股价连续两日 触及涨停。 又如 , 年 月互联网出现关于中信证券 ( 股票代码 的一系列传闻公司 “海外投资巨亏” 、“ 高管出事”,导致中信证券股价大跌。 虽然上市公司通过主流媒体对这些传闻进行了澄清,但传闻在网络媒体的迅速扩散已经导致相关股票的非理性波动, 中小投资往往在这一过程中遭遇损失。除了在这些特殊事件中传播不实信息 、放大非理性情绪从而造成个股股价的波动之外 , 网络媒体在日常的交易中是否还会对整体市场具有影响? 网络论坛中股民每天的海量发帖是否包含影响股票市场

4、未来的走势信息? 传统的金融理论认为 , 中新闻与传播研究 年第 期网络媒体对股票市场的影响小投资者的意见不会对股票市场产生显著的影响 , 因为股票市场由大型机构投资者主导, 专业投资分析师具有绝对信息优势; 而中小投资者所拥有的资金少 , 获得信息成本又很高 , 始终处在市场的边缘地带, 意见无法汇聚 ,更无法有效地向市场传递。 然而 , 有别于以往的只读式文化参与 , 网络内容生产的创造性和主动性开启了人们全新的网络使用方式 , 以股票论坛为代表的网络平台成为了中小投资者传播信息、 宣泄情绪的主要渠道。 当彼此分散的情绪与意见在论坛上碰撞融合,虚拟世界的信息洪流便可能转化为对现实世界的影响

5、力。 我们感兴趣的问题是 : 来自股票论坛的讨论是否已经强大到能够影响现实的股票市场?一、 研究背景与现状网络媒体对金融市场的影响是传播学与金融学交叉领域的研究主题。 在金融学的研究范式里 , 信息与股价的关系是一个核心问题。在互联网时代 , 信息的传播结构与模式发生了巨大变化 , 网络媒体对股价的动态影响受到金融学者的日益关注。与此同时 , 网络信息资源中所蕴含的丰富的文本情感知识也引发政府、 企业以及投资者等诸多主体的重视 , 成为体察社会舆情、探测用户需求心理的重要依据。 如何将金融市场、 网络媒体、 文本信息提取三者结合成为了当前的热点研究领域。股票论坛的研究中遇到的最大困难之一是难以

6、搜集与量化文本,故现有的研究多停留在数值型数据 , 实际模型的计算与推断极少考虑文本型数据。 例如 , 维索茨基 ( 以发帖量度量网络信息 , 考察了 年 月 至 月发帖量最大的家公司 , 发现发帖量的确能够预测第二天股票的交易量与异常收益率。 达 (等则用搜索强度 ( 来量化网络信息。 他们分析了 指数中每个公司的股票代码简称在谷歌 ( 的搜索强度 , 结果显示搜索强度对那些小规模市场的收益率具有更大的预测力 , 而对于那些以机构投资者为主的市场纽约证券交易所或纳斯达克 ) 的预测力则较小。在达等的基础上, 约瑟夫等将个股按照搜索强度分成了五组, 并以此建立了一个 “每周买入搜索强度最高组的

7、股票” 的投资策略。 他们发现该策略的超额收益率的确随着搜索强度的增加而增加 , 搜索强度最高的股票组比搜索强度最低的股票组平均每周收益率高 。发帖量、 搜索量等数值型数据具有维度有限的局限性, 只能间接体现投资者的意见 ; 而文本数据来源广泛 、 信息完整 , 作为语言主观性的体现直接表达了投资者的立场 , 具有数值型数据无法比拟的优势。 目前国外巳经有学者开始应用网络媒体的文本型数据进行金融研究 。 一个经典的研究来 自安特魏莱尔 ( 与弗兰克 ( , 他们采用朴素贝叶斯算法将来自 雅虎金融 ( ! 里的万条帖子分成看空 、看多、 持平 (包括噪音) 三类 , 并由此构建了一个投资者看涨指

8、数 , 结果发现论坛信息可以预测股价的波动率。 博伦 ( 等人借助谷歌的新闻与传播研究 年第 期网络媒体对股票市场的影响文本挖掘工具来考察投资者情绪。他们搜集了 年 月 日至 月 日之间近万条推特 (上的公共微博, 采用谷歌的 与工具来分析微博文本的情绪倾向 , 并用该情绪倾向来预测第二天道琼斯指数的涨跌, 发现预测的准确率达到了 。从国内的研究情况来看 , 研究网络媒体数值型变量与股价的关系 已经开始出现。 然而, 分析网络媒体文本型数据与我国股票市场关系的研究还非常缺乏。 我们认为和国外相比, 研究网络媒体在中国股票市场上产生的效应更加有意义 , 其原因有以下两点 : 第一 , 中国股票市

9、场散户众多 , 且股民与网民高度重叠 , 网络媒体是中国股市个体投资者获取信息和表达情绪的重要平台 ; 第二, 中国股票市场具有“消息市”、“政策市” 的典型特征 , 与传统媒体相比 , 中国股民更愿意从网络媒体中获得所谓的内幕消息 , 这使得网络媒体的效应进一步凸显。本文研究的意义在于应用文本挖掘技术 , 克服人工理解方式的低效性, 从海量的发帖文本中准确 、 快速 、 自动地提取其中的情感倾向 。 我们选取了东方财富网旗下的股票论坛“股吧”作为国内当前股票论坛的典型代表,不仅研究每只股票的发帖量等数值特征 , 而且从发帖文本中提取看涨指标和意见趋同指标 ,以此检验股票论坛是否会影响股票市场

10、。二、 研究假设检验网络媒体信息体现的意见倾向对股票市场价格、成交量的影响是本文的主要研究目 的。 为此, 本文首先希望通过提取股票论坛帖子所蕴含的意见倾向 , 构建看涨指数 , 检验网络论坛的看涨意见是否会对股价产生影响 , 其程度又如何; 同时我们将检验看涨意见是否能够帮助我们预测股市。 其次, 我们希望检验网络论坛意见分歧是否成为交易的动力。 有学者认为人们之所以会进行股票交易 , 是因为人们对于股价的未来走势具有不同的意见。 如果这个假设成立 , 那么我们应该观察到当人们意见分歧程度越大时, 股票的成交量就越多。 最后 , 发帖量反映了人们参与讨论的程度 , 而成交量反映了人们实际参与

11、交易的程度, 如果股票论坛与股票市场是相关的 , 那么我们应该可以观察到发帖量越多 , 成交量也就越多 。 为了具体研究网络媒体与股票市场的关系 , 我们提出如下三个假设:网络论坛文本信息体现的看涨意见指数越高 , 股票的收益率就越大 , 而且看涨意见指数对股票收益率具有预测作用 。: 网络论坛文本信息体现的投资者意见分歧越大,股票的成交量就越大。: 网络论坛发帖量与成交量呈正相关。三 、研究样本与数据的基本情况本文获取的所有发帖都来 自 于中国最大的股票论坛东方财富网股吧新闻与传播研究 年第 期网络媒体对股票市场的影响。 股吧是一个开放性的网络论坛 , 任何访问者可以匿名或者不匿名 ( 注册

12、会员 ) 地参与讨论。 股吧的讨论内容分为两类 , 一类是按主题设置的讨论区, 例如股市实战吧 ,财经评论吧等 ; 另一类是按个股设置的讨论区 , 在深沪两市主板、 创业板上市的所有股票都有各自 的讨论区 。 通常情况下 , 投资者要发表对某个股票的评论意见或者搜寻与该股票相关的信息都会进入该股票对应的专门讨论区。 由于机构投资者有自 己专门的平台进行网络信息的发布 (如证券公司的主页、博客、 微博等) , 股吧的讨论者绝大部分是散户 。我们运用网络爬虫工具 抓取了所有创业板股票的历史发帖数据作为样本 , 代码从 至 共计 只个股。 选择创业板的原因是因为创业板股票股本数小 , 股价波动大,更

13、容易反映市场情绪的波动。 样本期间从 年月持续至 年 月, 共有近 万条主帖与近 万条回帖。 由于大多数回帖十分简略 , 往往只有 “支持楼主” 、 “顶 等寥寥若干字 , 所蕴含的意见十分有限 , 而主帖则内容详尽 ,一般体现了明确的意见 , 因此在文本挖掘中我们只考虑主帖的内容。选择东方财富网作为数据来源理由如下 : ( 东方财富网在中国所有金融类网站中流量排名第二 ( 排名第一的为中国工商银行) , 能够最全面及时地反映中小投资者的意见。公开追溯时间长。 我们在东方财富网中最早能追溯到 年前的发帖 , 而排名仅次于东方财富网的和讯网 ( , 则只能追溯 个月前的发帖数据。 ( 变量齐全。

14、 东方财富网股吧保留了发帖人 、 发帖时间 、 标题、 点击量等变量。 表 展示了样本的基本情况。表 最终数据集数据描述主帖 ( 条 万总观测样本主帖 回帖 (条 ) 万起止日期 年 月 日 年 月 日样本期跨度 ( 自 然 日 交易 日 )每主帖平均点击数 ( 次 )每主帖平均回复数 ( 条 )每股日 平均发帖数 ( 条 )图 显示了一天 小时之内发帖量的时间分布图 。 创业板每天的交易时间为上午 至 , 下午 至 分别在图 中 用 竖线标识) 。 我们发现 ,发帖量在开市的上午和下午两个时间段达到了明显的高峰。 值得注意的是 , 发帖量在下午 与晚上再次上升。 我们推测,下午 点左右正值许

15、多股民临近下班 , 他们通常会在这个时间浏览股市行情、 了解信息, 在股吧发表自 己的意见。同样 , 许多白天无法关注行情的中小投资者往往喜欢在晚上 ( 晚 左右) 浏览股吧信息 , 并参与股吧的讨论。 总体上,在开盘期间的发帖量占一天总发帖量的新闻与传播研究 年第 期网络媒体对股票市场的影响左右 , 收盘期间的发帖则占到了 , 收盘期间的发帖要远远多于开盘期间的发帖。百比丨丨: : : :时间图 发帖量在一天中的分布我们还考察了发帖量在一周 、 一年内的 日历分布情况。 图 显示 , 周一的发帖量在一周内处于较低的水平。 谭松涛等对我国三大证券报信息量的周内分布进行过统计 , 发现周一的信息

16、总量显著低于一周内其他交易日 , 这与我们对网络论坛的发帖量统计是一致的 。 从信息流的角度来看 , 投资者在周一开盘前有更多的时间搜集和分析周五收盘以来的信息 , 因此市场在周一的分歧程度较小 , 相关论坛的讨论数量也显著降低。 论坛发帖量在周四和周五进入一周 内的最高水平。 图 显示了发帖量在一年内的分布 , 网络论坛发帖量最高的月份是 月 与 月 。 原因可能有两点 ,一是农历春节过后, 市场资金逐步人场 , 论坛发帖量随着市场的活跃程度相应提升;二是我国的上市公司通常在 至 月披露年度财务报告, 月披露半年度财务报告,此时股市进入所谓的 “年报 ( 半年报) 行情” , 投资者有关上市

17、公司收益 、分红及其股票涨跌的讨论由此进入了高潮期。四 、 运用文本挖掘技术建立看涨指数与意见趋同指数网络论坛从本质上来说是投资者意见积聚、 传播的平台 。 由于网络论坛具备匿名性 、 互动性、 草根性的传媒特征 , 网络帖子可能包含真实的信息 , 也可能包含虚假的信息 , 也可能仅是没有实质信息的情绪表达。 无论帖子是否具有实质信息 , 股吧的帖子体现了投资者对特定股票未来趋势的倾向性意见。这种意见通过网络媒体的传播 、 扩散 , 影响了个体的投资决策 , 并最终可能对股票市场的走势产生影响。新闻与传播研究 年第 期网络媒体对股票市场 的影响发贴諫: : :、 二丨 丨 丨周 日 周“ 周二

18、 周二 周四 周五 周六星期图 发帖量在一周 中 的分布发贴数、;, ,月份 )图 发帖量在一年中的分布为了实现本文的研究目标 , 我们将利用文本挖掘技术提取股吧帖子文本中所包含的意见 , 构建看涨指数和意见趋同指数两个指标, 检验这两个指标是否会对股票市场的价格和成交量产生影响 。 看涨指数衡量了投资者意见的总体方向 , 从平均意义上统计投资者对某只股票走势的倾向性意见 , 看涨指标越高意味着投资者普遍认为该股票会上涨。 意见趋同指标衡量了市场意见的分歧程度 , 意见趋同度越低代表着投资者各自 的意见存在较大的分歧。 我们首先构造个股的看涨指数与意见趋同指数 ,然后在个股的基础上加总得到整个

19、市场的指数。新闻与传播研究 年第 期网络媒体对股票市场的影响我们对股吧帖子文本数据的处理包含分类与指标构建两个主要步骤。 首先采用文本挖掘工具提取每条发帖所蕴含的情绪,并用数字编码 , 然后将加总这些编码 ,得到我们需要的指数。一) 用文本挖掘方法对帖子进行分类本文借助文本挖掘工具将近百万条股吧发帖按照其所体现的意见类型分成三类 :“看涨”、“中立 噪音”、“看跌”。 我们使用应用最广泛的数据挖掘开源包 ,在将多种算法进行对比后最终选择正确率最高的 算法, 并选参数 。 用计算机进行文本分类的过程如下: 首先从全体样本中随机抽出一小部分进行人工分类,这些抽取出的数据被称为“训练数据集”; 然后

20、计算机通过学习训练数据集的结果建立起自己的分类模型; 接着, 我们将训练得 的分类模型反过来应用于训练数据上进行验证, 如果得到的结果和人工的分类结果十分接近 , 那么就说明我们建立的分类模型是合理的 , 可以将它应用在待分类的数据集上。作为学习样本的训练数据集的正确与否对于最后的分类效果有很大影响。 为了保证训练数据集的分类客观、有代表性 , 我们从全体样本中抽取 条帖子,邀请了两位金融学研究生、一位资深股民共同进行分类 , 最后取三人的众数作为结果 ,若三人的分类结果都不一样 , 则该帖归为中立 噪音类。 表 展示了具有代表性的帖子分类。表 具有代表性的帖子分类类别 样例帖子“看好百元潜质

21、股票, 求佛祖保佑中签 ! !”乐观看涨“傻子在卖掉股票 !”“错过这村就没这店 了, 大家别犹豫”“新手入市, 请教高手”中立 噪音 “哪位朋友知道啥时出年报和季报”“ 明天的走势强劲么 ? 近期回调的几率多大啊”“我先跑了 , 太吓人了, 大盘完蛋了”悲观看跌 “哈哈,又套了 无数人”“发帖立誓 , 以后永不碰此股 ,”最终的文本分类结果展示在了表 中。该表展示了人工分类与计算机分类的交叉验证结果。以第四行的数据为例,“ ”表示训练数据集中有 的帖子被人工分类为 “积极”; 、”分别表示对于训练数据集中被人工分类为“积极” 的帖子而言 , 有 的帖子被错误地归为了 “消极” 类别, 有 被

22、错误地归入了 “中立 噪音”类, 而剩下的 被正确地归人了积极类。 表 对角线上的数字相加即为正确判断的百分比 ,在我们的例子中 , 总体分类正确率约新闻与传播研究 年第 期网络媒体对股票市场的影响。 需要指出的是 , 虽然模型将一部分积极与消极的帖子归入到了中立 噪音类别 , 但混淆积极与消极的错误却很少出现。 这说明我们的分类结果可能一定程度上弱化了意见 , 但在意见方向的判断上还是相当正确的。表 算法在训练数据集与全样本中的表现分类结果 (类别 人工分类结果 ( 消极 中立 嗓音 积极消极中 立 噪音积极训练数据集全体数据集注 : 训练数据集共 条数据 ; 全体数据集共 卯 条数据。粗体

23、表示帖子被正确分类的比例 。二) 看涨指数与意见趋同指数的构建在将帖子体现的意见分成三类之后 , 我们需要构建一个看涨指数将某段时间的意见 “加总” 起来。 借鉴安特魏莱尔与弗兰克的方法 , 我们用对, 表示一天中具有“积极或者乐观” 意见的发帖量 , 用表示一天中“消极或者悲观” 意见的发帖量 , 用表示一天中所有带意见的帖子的数量,即 那么看涨指数可以构造如下:、,尽越大 , 说明看涨的人越多 , 情绪越高涨激昂 ; 越小 , 说明看跌的人越多 , 情绪越低落, 其中 , 民的取值范围为 ( , 。但是 ,上述指数没有考虑到发帖量的影响 , 一般而言 , 该天带意见的发帖量越多 , 那么这

24、种意见也就越强烈 , 所以我们在尽 的基础上构建另一种看涨指数:加这个新的看涨指数既反映了情绪的变化 , 又考虑了发帖量的变动 , ,我们在后文都采取这种改进后的看涨指数。从定义上来看 , 看涨指数越高, 表明 多的投资者持买入的意见, 股票价格上涨的可能性就越大。接下来我们构造意见趋同指数。 反映意见是否一致的最好标准就是看涨指数尽的方差。 其构造如下 : 我们用 七表示第条帖子的类别 ,“看涨”、“ 中立 噪音”、“看跌” 分别对应数字 , , , 那么在时间段 内 , 看涨指数 尽 的方差便可以表示为 :新闻与传播研究 年第 期网络媒体对股票市场的影响在上式中 , 尽相当于一天中的平均意

25、见, 表示每一条帖子和该天的平均意见相差多少。 将这种差距的平方积累起来 , 便可以衡量意见的分歧情况。 最后,我们用上文的方差构建如下意见趋同指数:卓越大 , 说明意见越趋同 , 分歧度越低。在构造指数的过程中 , 如果我们按照个股加总发帖 , 那么我们将得到个股对应的看涨指数与意见分散指数; 如果我们将整个市场的发帖进行加总 , 那就能得到市场的看涨指数与意见分散指五、 研究样本与数据的基本情况一) 相关性分析由于我们构造的指数分别对应于个股与市场 , 于是便得到了两张相关系数表。表 中的所有变量都是基于个股计算的 , 表 中的所有变量都是基于整个市场的加总数据计算的 。 我们在两张表中汇

26、报了主要变量之间的相关系数。 股吧的变量包括我们计算出的看涨指数与意见趋同指数, 以及原始的发帖量。 股票市场的变量包括每日收益率和每日成交量。表 各变量的相关性分析 (各股)看涨指数 意见趋同指数 发帖量收益率 成交量看涨指数 ” 意见趋同指数 发帖量 收益率成交量注:表中数据为个变量的相关 系数。分别表示 水平显箸 。表 各变量的相关性分析 ( 市场)看涨指数 意见趋同指数 发帖量 收益率 成交量看涨指数意见趋同指数 发帖量收益率成交量注: 表中数据为个变量的相关 系数。 分别表示 水平显箸。观察表 与表 , 我们发现看涨指数与收益率都呈显著正相 , 但是市场层面的相关性 (相关系数 要明

27、显强于个股层面上的相关性 (相关系数 。 这一结果新闻与传播研究 年第 期网 络媒体对股票市场的影响意味着对个股的加总似乎抵消了异质性误差, 也就是说, 和追踪个股的收益比起来,看涨指数追踪整体市场收益率的能力可能更强。 总体上 , 相关性分析结果支持了本文提出的假说 。其次 , 我们发现意见趋同指数与成交量呈负相关 , 本文的假说 成立。 这意味着交易的实现是因为人们对于股票的真实价值具有不同观点 , 意见不一致的人越多 ,越容易促成交易的达成。 表 同时显示发帖量与成交量高度正相关 , 本文假说 成立。 这表明发帖量的确反映了投资者的市场参与程度。为了能够更直观地观察看涨指数对市场的影响

28、, 图 展示了样本股票在每个交易 日的平均看涨指数与同期创业板收益率的动态关系 。 图 中上半部分表示的是创业板指数日收益率, 下半部分表示的是看涨指数 , 两个变量在波动情况上具有一定的趋同性。 图 显示了样本期间 日发帖量与同期创业板成交量的动态关系 。 从图中我们可以看到 日发帖量的走势与成交量非常密切。创业板指数日收益率 看涨指数指 瞀购, 簾、次、次分、 义 声參交易 日期图 看涨指数与创 业板指数收益率二)回归分析主要变量的相关性分析表明网络论坛蕴含的意见倾向与股票市场有密切的关系 ,然而我们构造的指数是否能有效影响并预测个股与市场的变化则需要进一步的回归分析来验证。网络信息对市场

29、指数的影响图 显示了看涨指数与创业板市场指数回报率的关系 。 图上的每个点都代表了一个交易 日 , 实线表示用看涨指数拟合指数收益率得到的结果, 图中 表新闻与传播研究 年第 期网络媒体对股票市场的影响示指数收益率 , 为上文定义的看涨指数, 括号内为 值。虽然我们的模型只有看涨指数一个解释变量 , 但还是达到了 的拟合优度 , 特别是 , 看涨指数在模型中呈显著 ,值达到了 ,且几乎所有点都落到了 的预测限内 。 这一结果和相关性分析的结果一致。创业板指数成交量 日发帖量丨数里隻量、今、次、爹交易日期图 日发帖量与市场成交量的 关系一, 篇。率 方 删!看涨指数拟合 置信限 预测限图 看涨指

30、数与市场回报率新闻与传播研究 年第 期网络媒体对股票市场的影响网络信息对个股的影响表 展示了使用面板模型的回归结果。 样本包括 只股票共 个交易 日 ,采用固定效应模型。 其中因变量分别为个股日收益率与日成交量, 自变量分别为发帖量、 看涨指数、 意见趋同指数与整个创业板市场收益率。 我们加入创业板市场的日收益率作为控制变量的目的是因为市场收益率能够解释个股收益率的系统性变化,如果此时来自股吧的变量系数显著, 那就意味着这些变量能为我们带来超额的解释力。首先我们来看个股收益率的同期回归方程。 表 已经说明 , 个股收益率与看涨指数显著正相关,而表 用面板模型再次证明了这个结论。我们看到, 回归

31、方程中看涨指数的系数为 , 且在 的置信度下显著, 说明看涨指数每增加个单位 ,个股收益率就增加 个百分点, 满足假设 。 此外, 发帖量对日收益率的显著性比看涨指数要弱, 说明反映发帖内容的看涨指数比反映发帖数量的变量更具有解释股票收益率的能力 , 网络信息的文本挖掘具有重要的研究意义。表 回归结果解释变量被解释变量对数发帖量 看涨指数 意见趋同指数 市场收益率曰收益率 (, 产对数成交量 (注: 表中数据为个变量的估计系数, 括号内 为 值。 被解释变量下的 ( 、 表示方程编号。 , 分别表示水平显著 。接着我们考察成交量的回归方程 ( 。 所有自变量都在 的置信度下显著,发帖量每增加

32、, 个股成交量就增加 ; 看涨指数每增加 个单位, 成交量就增加 意见趋同指数每增加 个单位, 成交量就减少 。 总之, 更乐观的情绪与更为分散的意见伴随着更大的成交量, 与假设 和 相符。在实际交易中, 预测未来变动的能力比变量同期间的相关性更加重要。 为了检验看涨指数的变化是否先于股票市场的变化, 我们在表 中引人了变量滞后项进行时间序列回归, 并参考安特魏莱尔和弗兰克的做法将滞后项设置为滞后两期。 选择两期滞后的另一个理由是,股吧中的帖子更新十分快,股民往往只关注最近几天的发帖, 而三天以上的帖子往往被认为是“ 旧” 的信息而不再受到关注。与不带滞后项的回归一样, 我们也加入市场收益率来

33、控制系统性因素的影响。在表 中 , 我们将证券市场变量作为因变量, 将发帖量、 看涨指数等网络信息变量的滞后期作为自变量。 变量的下标 表示第 期, 表示滞后一期, 以此类推, 我们仍旧采用固定效应的面板模型进行拟合。新闻与传播研究 年第 期网络媒体对股票市场的影响先来从表 中看回归方程 ( 。 我们发现看涨指数的滞后期对收益率具有预测作用, 卩日的看涨指数越高, 日 的股票收益率也往往越高。不过,日 的看涨指数对于收益率的影响却是不显著的。看涨指数对于第二天的收益率失去预测能力可能是由于网络媒体具有及时性的特征。 传统的媒体有一定的出版周期或者需要一定的传播时间 ,而网络媒体则具备信息传播和

34、意见汇集的瞬时性, 旧的帖子 (信息) 会迅速地被新的帖子 ( 信息)所覆盖, 从而不再对市场起作用。事实上, 我们可以将论坛的发帖看作股民对股票基本面的解读。 可能的情况是,股票的基本面没有发生变化, 但股民每天根据自己得到的市场信息对基本面产生不同的解读。 这种主观的、 情绪化的解读很容易改变, 因此在本文中 , 由每日论坛文本提取的看涨指数对当天及下一个交易日 的股票价格有显著的影响,而该影响在第三个交易日就消失了 , 这是因为新的意见开始发挥作用, 原有意见的影响力则不复存在。另外一点值得注意的是, 回归方程 ( 中的系数都很小, 期的看涨指数增加 个单位,个股收益率才增加 个百分点。

35、 考虑到目前个人投资者的交易费用率最低为 , 而且两日 看涨指数相差个单位的交易日 只占全体交易日 的用看涨指数构造投资策略并不有利可图。其次, 回归方程 (与回归方程 说明 , 发帖量与意见趋同指数对于成交量也有正向的预测能力 , 并且这种预测能力随着时间的推移而减弱。 最后, 表 中回归方程 ( 再次证明了成交量与意见趋同程度之间的负向关系。表回归结果解释变量 , ,被解释变丨对数成交量, ( 对数成交量, ( 对数成交量 个股曰收益率,个股曰 收益率,(对数发帖量对数发帖量看涨指数 ”看涨指数意见趋同指数意见趋同指数“市场收益率,“ “注: 表中数据为个变量的估计系数, 括号 内为 值。

36、 被解释变量下的数字 ( 表示回归方程编号。分别表示 水平显著。综上, 表 的结果再次验证了假设 至 并加以推进: 股票市场与股吧不仅有相关性, 而且来自股吧的意见倾向还能帮助我们预测股票市场未来的变化,但由新闻与传播研究 年第 期网络媒体对股票市场的影响于股吧的发帖更新速度快 , 滞后多期的发帖对本期的影响在统计学上并不显著 ; 即使对于那些统计显著的变量 , 由于其系数很小 , 也并不意味着看涨指数能带来可观的经济收益。六、 结论与讨论论坛发帖的传播学效应已经成为了传播学研究的热点话题之一, 本文的创新之处在于运用文本挖掘工具, 实现对海量帖子的文本语义分析。 我们将近百万条帖子提炼为两个

37、核心指数: 看涨指数与意见趋同指数 , 这两个指数反映了论坛文本信息最重要的特征。 我们得到的主要结论是股票论坛发帖的内容与股票市场密切相关。首先, 我们构建的看涨指数和股票的收益率正相关, 看涨指数每增加 个单位 , 个股收益率就增加个百分点 , 而且滞后一期的看涨指数对于收益率具有预测作用,但由于股票论坛的发帖更新十分迅速 , 滞后多期的看涨指数的影响在统计上则并不显著。 其次, 成交量也显著受到意见趋同指数与发帖量的影响 , 意见趋同指数每增加 个单位 , 成交量就减少 发帖量每增加 成交量就增加 。本文的结论说明网络论坛对股票市场的影响及时、 迅速且具有统计上的显著性 ,但是由于系数很

38、小 , 这种统计意义上的显著性难以转化为经济利益。 然而, 我们可以预见随着网络技术的不断发展, 网络这一传播途径在股票市场中所产生的作用将变得越来越不可忽视。以有效市场理论为代表的金融学理论认为 , 信息对于证券交易行为起着决定性的作用。 然而, 信息如何影响证券行为 , 影响是快是慢 , 程度如何, 却取决于信息的传播渠道。一个好的传播渠道可以将信息的成本减少到最低, 从而大大提升市场的有效性, 减少内幕交易等违规现象;而一个不畅通或模糊的渠道却会加剧证券行为的非理性活动。 众所周知 , 互联网正在 , 并且必将成为未来信息传播的最主要渠道。 在我国股票市场当前信息披露制度不完善的情况下,

39、 以网络论坛为代表的网络媒体上很有可能充斥着虚假信息 , 投资者通过网络论坛的互动很可能引发非理性情绪的传染与扩大 , 并最终影响股票市场的稳定性。 年 月黄金期货价格暴跌,内地香港出现 “抢金潮” , 多家国内媒体, 特别是网络门户使用 “ 中国大妈 天扫金 吨 , 维稳国际金价” 作为标题报道。 然而黄金行业协会表示 , 中国黄金消费按月度统计 , 天内不可能有统计结果 , 而且中国 年全年消费黄金 吨,天消费 吨的数字过于离谱。 从以上例子中我们可以看到 , 及早认识到网络媒体的重要性 , 了解互联网信息的传播特点 , 进一步完善我国股票市场信息披露制度,以及做好网络信息管理与舆论危机的

40、应对准备是金融监管当局面临的重大挑战。本文所用的文本挖掘技术为研究海量文本数据提供了一个可操作的方法, 同时本文也在检验网络舆论对专业领域的影响方面做出了有益的尝试。 但是由于相关条件的限制 , 本研究不可避免地存在一系列局限性 , 例如没有对沪深两个主板的股票新闻与传播研究 年第 期网络媒体对股票市场的影响作出考察, 缺少交易的高频数据等,我们将在后续的研究中进一步完善。本文系 国家 自科基金青年项 目 “基于文本挖掘的 网络信息 与股票市场关联机制研究”的研究成果 , 项 目编号 : 。作者 : 浙江大学经济学院教授, 博士生导师浙江大学经济学院博士生浙江大学经济学院副教授, 通讯作者注释

41、钟瑛、 余秀才 : 重大网络舆论事件及其传播特征探析 , 新闻与传播研究 年第 期 , 第 页。 夏雨禾 : 突发事件中的微博舆论 : 基于新浪徽博的实证研究 , 新闻与传播研究 年第 期 , 第 页。:“,申琦、 廖圣清 : 网络接触、 自我效能与网络内容生产网络使用影响上海市大学生网络内容生产的实证研究 , 新闻与传播研究 年第 期 , 第 页。,“;“, “,“: ,”, , , ,兰秋军、 马超群 : 文本感知金融研究新动态 , 长沙理工大学学报 (社会科学版) 年第 期 , 第 页。, ,“, ,饶育蕾、 彭叠峰 、 成大超 : 媒体注意力会引起股票的异常收益吗? 来自 中国股票市场

42、的经验证据 , 系统工程理论与实践 年第 期 , 第 页。 饶育蕾 、 王攀 : 媒体关注度对新股表现的影响来自 中国股票市场的证据 , 财务与金融 年第 期 , 第页。 贾春新 、 赵宇、 孙萌等 : 投资者有限关注与限售股解禁 , 金融研究 年第 期 , 第 页。张永杰、 张维等 : 互联网知道的更多么?网络开源信息对资产定价的影响 , 系统工程理论与实践年第 期 , 第 页。, ,新闻与传播研究 年第 期网络媒体对股票市场的影响是目前广泛使用的开源网络爬虫工具, 可在 下载数据来源于 它是由 中国互联网协会主办的统计中国各网站流量的非盈利性组织。谭松涛 、 王亚平、 刘佳 : 渐进信息流

43、与换手率的周末效应 , 管理世界 年第期 , 第 页。在对帖子进行分类之前, 我们对粘干文本还有大量的处理工作 , 包括利用向量空间模型对文本进行数学表达 , 根据网络语言特点构建停用词库, 以及使用分词包对帖子文本进行分词等。 由于篇幅所限,以上非核心技术细节在此省略。全名是怀卡托智能分析环境 ( 是一款免费的 、 基于 环境下的开源数据挖掘软件, 由新西兰怀卡托大学 小组开发, 可在下载。我们一共测试了 、 朴素贝叶斯、决策树( 、 支持向量机 ( 种最常见的算法。 算法的基本原理是, 如果一个样本与 个最相似的样本中的大多数属于某一个类别 , 则该样本也属于这个类别。 例如 , 在 时,

44、 有某条待分类的帖子,我们找出他在训练数据集中特征最相近的 条帖子, 如果其中有条帖子都是积极类 ,则该帖也被分类为积极。其中 ,个股收益率为无红利再投资的 日收益率, 市场 ( 指数) 收益率为创业板流通市值加权市场组合收益率。“:, , ,新闻与传播研究 年第 期36 Efe c t s o f On l in e M e d ia o n S t o ck M a rke t : A n En ir ic a l S tu d y o n E a s tmo n e y . com? JmX u ejan , Zh u Yu, Yan g Xiao knD o s m a l l ta

45、lk s o n th e s t o c k m e s s a g e b o a r d s m o v e re tu rn an d v o l um e ? T o a n s w e r th is q u e s t io n, w ec ra w le d n e a r l y s ix m ill i o n m e s s a g e s p o s t e d o n C h in as la rg e s t s to ck m e s s ag e b o a r d, an d a d o p t e d a t e x tm in in g a l g o r it hm t o au tom a tic a l ly ex tr a c t in v e s t o rso p in io n . U s in g th is , w e c o n s t ru c t a “:,“;新闻与传播研究 年第 期

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报