1、ARIMA 模型和 BP 神经网络组合模型在卫生政策评估中的实证比较:以公立医院价格改革为例 马爱霞 谢静 唐文熙 中国药科大学国际医药商学院 摘 要: 目的:探索不同反向事实构建方法对医院财务数据预测的效率, 以期对政策进行更有效的评估。方法:借助 R 软件, 用南京市公立医院 A 在 20112016 年的药品收入、医疗服务收入建立测试数据集, 分别用 ARIMA 模型、BP 神经网络、ARIMA+BP 组合模型进行预测并与实际拟合, 并比较改革前后补偿率。结果:三个模型对药品收入的均方根误差分别为 692.82、501.44、380.80, 医疗服务收入的均方根误差分别为 184.04、
2、215.63、168.65, 组合模型预测效率更高。用组合模型计算改革后 A 医院药品收入净损失为 12 044.03 万元, 医疗服务收入净增长为 18 532.60 万元, 为药品收入损失的 153.87%。结论:医院财务数据因其线性与非线性的组合特征, 使用组合预测模型的预测效果最佳。但在实际应用中, ARIMA 模型操作简单, 与组合模型预测趋势也较为一致, 在实际卫生政策评估中也推荐使用。关键词: ARIMA 模型; BP 神经网络; 组合模型; 药品收入; 医疗服务收入; 政策评价; 作者简介:马爱霞, 女 (1961 年) , 博士, 教授, 博士生导师, 主要研究方向为药物经济
3、学与医药产业政策。E-mail:作者简介:唐文熙, E-mail:基金:国家自然科学基金青年项目 (71603278) Comparison of ARIMA Model, BP Neural Network Model and their combination use in health policy evaluation: an empirical study of urban public hospitals pricing reformMA Ai-xia XIE Jing TANG Wen-xi School of International Pharmaceutical Busin
4、ess, China Pharmaceutical University; Abstract: Objectives: To compare the accuracy of different time series models in prediction of revenue data in hospital, with further exploration in obtaining a more reliable counterfactual in health policy evaluation. Methods: ARIMA model, BP neural network and
5、 the combination of ARIMA and BP model were used and compared in estimation and prediction for drug revenue and medical service revenue with period from November, 2011 to October, 2016 for hospital X before ad after Nanjing medical pricing reform.Root mean square error (RMSE) was used to estimate th
6、e model accuracy.Results:RMSE of drug revenue from three models were 692.82, 501.44 and 380.80, and of medical service were 184.04, 215.63 and 168.65. The combination model was proved to be the most efficient one among the three. The net loss of drug revenue was estimated to be 120, 440 million, and
7、 the net increaseof medical service was estimated to be 185, 326 million, which was 1.539 times of the drug loss. Conclusions: The revenue data of hospitals are usually complex with a both linear and non-linear trend. The combination model of ARIMA and BP neural network could solve the problem for o
8、nce with an acceptable accuracy. However, ARIMA model is simpler to operate compared to other two models, and also more consistent, therefore ARIMA is also recommended in evaluation for health policies.Keyword: ARIMA model; BP neural network; Combination model; Drug revenue; Medical service revenue;
9、 Health Policy Evaluation; 城市公立医院医药价格综合改革后, 由于取消药品加成、提高医疗服务价格, 医院药品收入与医疗服务收入将会受到影响, 其中医疗服务收入的改变更是直接反映了改革取得的效果。一般来说, 随着社会经济的发展, 医疗服务收入本身呈增长趋势, 因此在评价政策效果时, 应该剔除数据本身存在的规律, 即构造“反事实”通过自身历史数据构建其发展趋势并用以预测“非改革”状态下数据的表现情况。医院收支数据多为时间序列, 常用的预测模型有线性时间序列模型、ARIMA 模型 (Autoregressive Integrated Moving Average Model
10、) 、BP (Back Propagation) 神经网络模型等123。本文选用ARIMA 模型、BP 神经网络模型以及 ARIMA+BP 组合模型, 探讨其预测效率, 以期为政策评价中反事实的构造提供方法学参考。1 模型简介1.1 ARIMA 模型ARIMA 模型全称为差分自回归移动平均模型 (Autoregressive Integrated Moving Average Model) , 是时间序列模型最常用的参数模型之一, 由 Box 和Jenkins 于 20 世纪 70 年代初提出。4模型运算过程为:先将非平稳时间序列转化为平稳时间序列, 然后将因变量仅对它的滞后值以及随机误差项的
11、现值和滞后值进行回归。ARIMA 模型由于在逼近许多平稳过程时具有较高的适应性, 因此常用于线性预测。模型完整形式为 ARIMA (p, d, q) , 其中 AR 是自回归, p 为自回归项;MA 为移动平均, q 为移动平均项数, d 为时间序列成为平稳时所做的差分次数。平稳化后预测公式如下所示:针对许多时间序列数据波动具有季节规律性, 可将 ARIMA 模型扩展为季节时间序列模型 (Seasonal ARIMA Model, SARIMA) , 即本研究采用的模型。SARIMA模型采用季节差分的方法去掉季节性, 可解决 ARIMA 模型无法解决的季节性问题。季节性建模处理与 ARIMA
12、模型类似。模型完整形式为 , 公式表达式如下所示:其中, P 为季节自回归阶数, Q 为季节移动平均阶数, s 为周期, 分别为季节 P 阶自回归算子和 Q 阶移动平均算子。服从均值为 0方差为 的正态分布。建立 SARIMA 模型, 应首先对季节性因素进行处理, 用观察法或统计检验确定季节性后, 对时间序列进行季节平稳性检验, 然后识别SARIMA 模型, 确定 P, D, Q, p, d, q 的取值, 随后进行参数估计与模型检验, 得到初步模型后便可使用 SARIMA 模型进行时间序列的仿真与分析。1.2 BP 神经网络模型BP (Back Propagation) 神经网络, 即误差反
13、向传播模型, 由信息的正向传播和误差的反向传播两个过程组成, 是一种最为常见且较为复杂的神经网络模型。5BP 神经网络是一个三层或以上的网络, 不仅包含输入层和输出层, 而且还有一层或多层隐层 (图 1) 。 即为 BP 神经网络的输入向量, 是隐含层的输出向量, Y 是输出层的输出向量, W ih和 Whj是 BP 神经网络的网络权值。图 1 三层 BP 神经网络结构图 下载原图此时节点的输出模型为:式 (3) 是隐含层节点的模型, 其中 f1 为激活函数, 一般取为输出值在 (0, 1) 之间的 Sigmoid 函数。式 (4) 是输出层节点的模型, 其中 f2 为激活函数, 通常为线性函
14、数。当实际输出与期望输出不符时, 进入误差的反向传播阶段。误差通过输出层, 按误差梯度下降的方式修正各层权值, 向隐藏层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程, 是各层权值不断调整的过程, 也是神经网络学习训练的过程, 此过程一直进行到网络输出的误差减少到可以接受的程度, 或者预先设定的学习次数为止。BP 神经网络模型对单变量的时间序列也可进行预测。以某一时间序列 X1, X2, , Xn为例, 预测时则认为预测值与前面 m 个值之间存在某种函数关系 , 构建Xt=F (Xt-1, Xt-2, , Xt-m+1) 函数关系。即将预测值 Xt当为输出变量 Y, 该值前面的 m
15、 个值 (X t-1, Xt-2, , Xt-m+1) 作为输入向量 X, 利用 BP 神经网络来推导未来值。近年来随着人工智能的不断发展, BP 神经网络已经成为预测非线性时间序列的主流模型之一。为解决时间序列的季节性波动问题, 从一般的 BP 神经网络发展出了季节性神经网络模型。设一时间序列 X= (X1, X2, , Xn) 是以 s 为周期的季节性时间序列, 根据季节性 ARIMA 模型理论, 认为未来的一个序列 Xt值是和历史 ds 个值之间存在某种函数关系, 函数关系为 Xt=F (Xt-1, Xt-2, , Xt-ds+1) , 用三层神经网络 (见图 1) 拟合该周期函数, 来
16、预测未来的 Xt值。1.3 ARIMA+BP 组合模型组合预测模型的思想最早在 1969 年由 Bates 等提出, Bates 等多位研究学者均指出并验证了单项预测模型的有效组合可以显著地提高预测效果6。将 ARIMA与 BP 预测模型进行组合, 能够结合 ARIMA 与 BP 模型的优势, 分别提取研究数据的线性和非线性变化特征7。目前使用最广泛的是线性组合预测模型, 一般的线性组合预测模型在时间序列应用时表达式如下:其中 yt为组合模型的预测结果, y t1, yt2分别为 ARIMA 和 BP 模型预测模型 t 期的预测值, w 1, w2为相应的组合权重。组合模型的难点在于最优组合权
17、重的确定。若权重不合理, 则有可能出现组合模型的预测效果比单项模型差的情形。目前, 确定权重的方法中被大多学者认可并采用的为数学优化方法, 即通过求误差平方和的最小值来确定最优的权重系数。假设 ARIMA、BP 模型、组合模型的预测误差分别为 e1t、e 2t、e t, 欲使组合模型误差平方和 E=e i最小, 则有:将 w2用 1-w1代入可以得到:组合模型误差平方和为:通过计算 E 的最小值, 即可得此时 w1, w2的值 (即最优权重) 。2 资料与方法2.1 资料来源本研究从南京市城市公立医院医药价格综合改革中选取代表性医院 A, 并择取选取药品收入、医疗服务收入两个指标进行预测。A
18、医院为三级甲等医院, 改革前后药占比分别为 40.91%和 36.09%, 医疗服务收入占比分别为 16.63%和20.92%, 在 57 所参改医院中属于中等, 且规模适当、管理规范, 因此较有代表性。2.2 研究方法鉴于南京价改于 2015 年 10 月 31 日零点正式开始, 样本区间设定为 2011 年 11月2016 年 10 月。按月收集改革前 4 年及改革后 1 年的数据, 以改革前 3 年 (2011 年 11 月2014 年 10 月) 的数据为训练数据, 以改革前 1 年 (2014 年 11月2015 年 10 月) 为测试数据, 分别运用 ARIMA 模型、BP 神经网
19、络及其组合模型对指标进行预测, 并与未构造反事实情况下的指标表现水平进行比较。数据分析过程在 R 软件中实现。3 预测结果3.1 药品收入预测比较建模前对原始数据进行预处理, 拟分析的数据形态如图 2 所示。可见, 数据有一定的上升趋势, 同时又伴随有周期性约为 12 个月的季节性波动, 符合医院药品月收入现实意义。图 2 药品收入原始数据 下载原图SARIMA 模型:在 R 软件中先调用 ts () 函数将原始数据转化为波动周期为 12 的季节性时间序列, 后运用 auto.arima () 函数, 判断通过一次差分和季节差分后数据转化为一个平稳时间序列, 再根据药品月收入时间序列一阶差分的
20、自相关和偏自相关函数构建模型为 ARIMA (0, 1, 1) (1, 1, 0) 12。BP 神经网络模型:本研究釆用滞后项预测法, 所构建神经网络模型的输入层节点数为 12, 输入的是待预测数据前的 12 个时间序列数据 yt-1, yt-2, , yt-12;输出层节点数为 1, 输出的是待预测数据 yt。此外, 隐含层的节点数通过经验法与试凑法确定为 10, 最终神经网络模型结构为 12-10-1。隐含层的激活函数为 log-sigmoid 函数, 输出层激活函数为线性函数, 设定迭代次数为 1000 次, 学习率为 0.02, 误差目标为 0.00001。考虑到本文的数据预测属于时间
21、序列长期预测, 因此采用迭代一步预测的方法。组合模型:借助软件计算得到 ARIMA 模型权重 Wl=0.3895, BP 模型权重w2=0.6105 时, 此时组合预测模型的误差平方和最小。三种模型预测结果数值如表 1 所示, 选用均方根误差 (RMSE) 对预测效果进行评估。指标表达式如下:从表 1 可看出组合模型的均方根误差最小, 预测效果最为精准;三者的预测结果趋势如图 3 所示, 其中测试数据是指 2014 年 11 月2015 年 10 月测试数据的真实值, 可以发现组合模型的拟合趋势与测试数据最为接近, 也进一步说明了其预测效果的精准性。表 1 三种模型对药品收入预测结果比较 (万
22、元) 下载原表 表 1 三种模型对药品收入预测结果比较 (万元) 下载原表 图 3 药品收入预测结果 下载原图3.2 医疗服务收入预测比较同理, 对医疗服务收入进行测算。医疗服务收入=医疗收入-药品收入-卫材收入-检查收入-化验收入。组合模型的最优系数分别为:w1=0.6658;w2=0.3342。计算结果如表 2, 发现组合模型预测的准确度最高。表 2 三种模型对医疗服务收入预测结果比较 (万元) 下载原表 图 4 医疗服务收入预测结果趋势图 下载原图3.3 与实际值比较3.3.1 改革对药品收入的影响根据前文研究的结果, 组合模型预测效果最优, 但为了对比不同模型预测与组合模型预测的差值情
23、况, 本文分别采用组合模型、ARIMA 模型以及 BP 模型对改革后 A 医院的药品收入进行反向事实数据预算。如图 5 所示, 三种模型预测趋势较为接近, 并且发现改革后, 改革后预测药品收入与实际药品收入相比有明显下降。图 5 改革后药品收入损失情况 下载原图三种模型预测的反向事实数据如表 3 所示, 用改革后 1 年实际药品收入减去改革前 1 年实际药品收入, 获得传统的改革药品收入损失量为 403.95 万元, 由于药品收入自身具有上升的趋势, 未剔除自身发展趋势, 将导致药品收入损失预测降低。运用反向事实数据预测得到的改革后预测药品收入, 利用改革后实际药品收入减去改革后预测药品收入,
24、 得到 ARIMA、BP 神经网络、组合模型三种模型预算的药品收入净损失量分别为 14 180.53 万元、10 680.94 万元、12 044.03 万元。相比于传统计算获得的药品收入损失, 三种运用反向事实数据预测获得的净药品收入损失更贴近改革实际带来的净效应。表 3 改革后药品收入反向事实数据的预测 (万元) 下载原表 3.3.2 改革对医疗服务收入的影响同理, 对医疗服务收入分别进行组合模型、ARIMA 模型以及 BP 模型进行反向事实数据预算。如图 6 所示, 三种模型预测的趋势均较为接近, 并且发现改革后, 改革后实际医疗服务收入比预测医疗服务收入有明显上升。图 6 改革后医疗服
25、务收入增加情况 下载原图三种模型预测的反向事实数据如表 4 所示, 按照传统计算方式:改革后医疗服务收入-改革前医疗服务收入, 获得医疗服务收入增加量为 22 541.3 万元, 由于医疗服务收入自身具有上升的趋势, 未剔除自身发展趋势, 将导致医疗服务收入增加量预测加大。运用反向事实数据预测得到的改革后医疗服务收入净增加量, ARIMA、BP 神经网络、组合模型三种模型预算的结果分别为 18 172.25 万元、19 250.51 万元、18 532.60 万元。相比于传统计算获得的医疗服务收入增加, 三种运用反向事实数据预测获得的净医疗服务收入增加量更贴近改革实际带来的净效应。表 4 改革
26、后医疗服务收入反向事实数据的预测 (万元) 下载原表 3.3.3 医疗服务补偿率医疗服务补偿率是指取消药品加成后, 医院通过调整医疗服务价格获得的对药品差价补偿的比例。传统的医疗服务补偿率和剔除数据自身发展趋势以获得改革后的医疗服务净补偿率计算公式如下:根据表 3、表 4 分别计算出传统医疗服务补偿比、与运用反向事实 3 个模型测算的医疗服务补偿比, 得到表 5。可以发现, 按照传统计算方式得到的结果与运用反向事实预测得到的结果相差较大, 这是由于药品收入和医疗服务收入自身均具有上升的趋势, 未剔除自身发展趋势, 将导致药品收入损失预测降低、医疗服务收入增加量预测加大, 因此计算出的医疗服务补
27、偿率与实际情况偏差较大。观察剔除数据自身发展趋势后获得的医疗服务净补偿率, 可以发现补偿率已经超过 100%, 证明改革后该医院增加的服务收入能够全额弥补甚至超出药品价格差额损失。表 5 医疗服务补偿率 下载原表 4 讨论4.1 反向事实的重要性从前文的分析中不难看出反向事实构建对医疗政策评价的准确度具有重要意义。现阶段, 我们对医疗卫生政策的研究多采用对比改革前后观测指标的方法来衡量改革成效8-9, 但这种评价方法存在一定的局限性。其中最主要的问题是忽视了指标数据自身发展趋势 (即反向事实数据) 对效果评价的影响, 在指标数据自身呈现正向或负向趋势时, 这种忽视就直接导致了改革后观测指标的变
28、化因素除了改革的影响外还包括了其自身客观发展的影响。具体而言, 当指标数据具有正向发展趋势时, 忽视反向事实数据将会导致评价机会成本下降、机会收益增加, 同样, 忽视具有反向发展趋势的反向事实数据则会导致评价机会成本上升、机会收益下降。因此, 剔除数据自身发展趋势即将反向事实数据纳入评价体系对获得改革的净效应具有重要意义。运用反向事实评价公立医院价格综合改革成效将最大限度还原改革所获得的净效应。4.2 组合模型捕捉线性和非线性效率更高ARIMA 模型, 与大多数时间序列预测方法一样, 各变量之间的线性关系也是其主要预测前提之一10, 但实际研究中总是或多或少地含有非线性因素, 当非线性因素影响
29、较小, 或在某一范围内影响较小时, 尚可采用线性模型来描述或逼近。但非线性影响较大或用线性逼近也得不到较好结果的时候, 非线性时间序列模型的运用就显露了其特有的优势。近年来神经网络模型的兴起为非线性模型预测提供了新思路。由于具备自动学习、逼近能够反映样本数据规律的最优函数, 且当函数形式越复杂时, 神经网络预测的效果越好11, 其在预测高复杂度的非线性时间序列方面明显优于传统的线性预测方法。总结而言, ARIMA 模型可对具有线性关系的数据进行时间序列预测, 对非线性数据的处理不尽合理, 且效果欠佳;BP 神经网络可挖掘出数据中隐含的非线性关系, 但由于不能反映时间序列的自相关和偏相关, 在处
30、理具有线性特征的数据时, 其效果往往不如 ARIMA。现实研究中, 很多数据都是既包含线性信息, 也包含非线性信息, 单个的预测模型很难充分捕获时间序列中所包含的信息, 而此时组合模型可以结合不同预测模型的优势, 尽可能多的获取时间序列数据中的信息。医院财务数据是医院医疗工作的经济基础、健康发展的基石, 更是评价公立医院综合价格改革成效的重要依据。由于医院财务数据会受到各类因素波动的影响, 如人口结构、疾病谱变化、季节性流行疾病、医生处方习惯、药品价格、服务价格等, 均会导致医院财务数据具有复杂的线性与非线性组合特征, 因此在用组合预测模型的预测效果最佳。4.3 时间序列模型的局限性及选择建议
31、在实际操作时, BP 神经网络模型隐含层层数和单元数的选择在理论上尚缺乏有力指导, 一般是根据经验或反复实验进行确定, 一定程度上增加了网络学习的负担。网络的学习和记忆还具有不稳定性, 其对之前的权值和阈值缺乏记忆, 在增加学习样本的情况下, 网络需从头训练, 故而 BP 及其组合模型的预测也会比较难12。ARIMA 模型预测精度虽然没有组合模型预测的效果好, 但预测的趋势与组合模型趋势也较为一致, 且其操作性简单, 实际应用性相对较强。一般而言, 在预测时间序列数据时, 当数据长度越长, 模型拟合预测效果也将越好, 但本研究的时序数据仅限于十三五规划期间的数据, 建议其他学者在有条件的基础上选取更长的数据进一步研究探索。参考文献1李望晨, 崔庆霞, 张利平.基于趋势外推与 ARIMA 预测我国医院诊疗及住院人次J.中国卫生统计, 2016, 33 (3) :477-478.