1、1牙膏销售量的研究摘要本文从收集有关牙膏销售量数据开始,从牙膏销售量和价格、广告投入之间的关系出发,分别通过对这三个方面的深入研究从而制定出各自的最佳方案,最后再综合考虑这三个主要因素,进一步深入并细化,从而求得最优解。模块中,我们假设在 和 对 y 的影响独立 ,从而得到了方程:1x220123yx在模块中,我们假设 和 对 y 的影响有交互作用,进一步得到新的方1x2程: 01234yx【关键字】线性回归模型 相关系数一、 问题提出由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型。通过对数据的统计分析,找出与数据拟合最好的模型,回归
2、模型是用统计分析方法建立的最常用的一类模型。建立牙膏销售量与价格、广告投入之间的模型,预测在不同价格和广告费用下的牙膏销售量 二、 问题分析某大型牙膏制造企业为了更好地拓展产品市场,有效地管理库存,公司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量与销售价格、广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。为此,销售部的研究人员收集了过去 30 个销售周期(每个销售周期为 4 周)公司生产的牙膏的销售量、销售价格、投入的广告费用,以及同期其它厂家生产的同类牙膏的市场平均销售价格,见表 1-1(其中价格差指其它厂家平均价格与公司销售价格之差) 。试根据这些数据建立一个数
3、学模型,分析牙膏销售量与其它因素的关系,为制订价格策略和广告投入策略提供数量依据。表 1-1 牙膏销售量与销售价格、广告费用等数据2销售周期公司销售价格(元)其他厂家平均价格(元)价格差(元)广告费用(百万元)销售量(百万支)1 3.85 3.80 -0.05 5.5 7.382 3.75 4.00 0.25 6.75 8.513 3.70 4.30 0.60 7.25 9.524 3.60 3.70 0.00 5.50 7.505 3.60 3.85 0.25 7.00 9.336 3.6 3.80 0.20 6.50 8.287 3.6 3.75 0.15 6.75 8.758 3.8 3
4、.85 0.05 5.25 7.879 3.8 3.65 -0.15 5.25 7.1010 3.85 4.00 0.15 6.00 8.0011 3.90 4.10 0.20 6.50 7.8912 3.90 4.00 0.10 6.25 8.1513 3.70 4.10 0.40 7.00 9.1014 3.75 4.20 0.45 6.90 8.8615 3.75 4.10 0.35 6.80 8.9016 3.80 4.10 0.30 6.80 8.8717 3.70 4.20 0.50 7.10 9.2618 3.80 4.30 0.50 7.00 9.0019 3.70 4.10
5、0.40 6.80 8.7520 3.80 3.75 -0.05 6.50 7.9521 3.80 3.75 -0.05 6.25 7.6522 3.75 3.65 -0.10 6.00 7.2723 3.70 3.90 0.20 6.50 8.0024 3.55 3.65 0.10 7.00 8.5025 3.60 4.10 0.50 6.80 8.7526 3.70 4.25 0.60 6.80 9.2127 3.75 3.65 -0.05 6.50 8.2728 3.75 3.75 0.00 5.75 7.6729 3.80 3.85 0.05 5.80 7.9330 3.70 4.25
6、 0.55 6.80 9.26MATLAB 作图得到 2.1 如下所示(相关程序代码见附录 1) ;3图 2.1 牙膏销售量与销售价格、广告费用的关系图三、 模型假设假设收集的数据均真实有效。四、 定义与符号说明y 公司牙膏销售量其它厂家与本公司价格差1x公司广告费用2y被解释变量(因变量) 解释变量 (回归变量, 自变量) 12,x4回归系数 随机误差(均值为零的正态分布随机变量)五、 模型的建立与求解(一)基于 和 对 y 的影响独立 -模型1x21、作出图形,如下图:由数据 y,x1,x2 估计 b,bint,r,rint,stats=regress(y,x,alpha) 输入 yn 维
7、数据向量 x=1 x1 x2 x22n4 数据矩阵, 第 1 列为全 1 向量,alpha(置信水平,0.05) 输出 b 的估计值,bintb 的置信区间 ,r 残差向量 y-xb ,rintr 的置信区间 Stats检验统计量 R2,F, p 参数 参数估计值 置信区间 0 17.3244 5.7282 28.9206 1 1.3070 0.6829 1.9311图 表 标 题012345678910-0.2 0 0.2 0.4 0.6 0.8价 格 差销售量 销 售 量 ( 百 万 支 )线 性 (销 售 量 ( 百 万支 ) )5 2 -3.6956 -7.4989 0.1077 3
8、0.3486 0.0379 0.6594R2=0.9054 F=82.9409 p=0.0000y 的 90.54%可由模型确定 p 远小于 =0.05,2 的置信区间包含零点 (右端点距零点很近) , x22 项显著。 F 远超过 F 检验的临界值,模型从整体上看成立,x 2 对因变量 y 的影响不太显著,可将 x2 保留在模型中。销售量预测 23210xxy价格差 x1=其它厂家价格 x3-本公司价格 x4。估计 x3控制 x1通过 x1、x 2预测 y。控制价格差 x1=0.2 元,投入广告费 x2=650 万元。(百万支)9.823210y销售量预测区间为 7.8230,8.7636(
9、置信度 95%) 。上限用作库存管理的目标值,下限用来把握公司的现金流 。若估计 x3=3.9,设定 x4=3.7,则可以 95%的把握知道销售额在 7.83203.7 29(百万元)以上。(二)基于 和 对 y 的影响有交互作用 -模型12参数 参数估计值 置信区间 0 29.1133 13.7013 44.5252 1 11.1342 1.9778 20.2906 2 -7.6080 -12.6932 -2.5228 3 0.6712 0.2538 1.0887 4 -1.4777 -2.8518 -0.1037R2=0.9209 F=72.777 p=0.0000交互作用影响的讨论 21
10、423210 xxy价格差 x1=0.1 1. 67.058.763x价格差 x1=0.3 22.041 xy6537.2x1.03.01xxy价格优势会使销售量增加加大广告投入使销售量增加(x 2 大于 6 百万元)价格差较小时增加的速率更大 价格差较小时更需要靠广告来吸引顾客的眼球 六、 模型的评价两模型销售量预测比较控制价格差 x1=0.2 元,投入广告费 x2=6.5 百万元。, (百万支) ,区间 7.8230,8.763623210xy93.8y, (百万支) ,区间 214272.7.8953,8.7592 略有增加,预测区间长度更短y七、 附录附录 1:“图 2. 1 各年度学
11、费占教育经费的比例的情况”的程序代码x1=-0.05 0.25 0.60 0.00 0.25 0.20 0.15 0.05 -0.15 0.15 0.20 0.10 0.40 0.45 0.35 0.30 0.50 0.50 0.40 -0.05 -0.05 -0.01 0.20 0.10 0.50 0.60 -0.05 0.00 0.05 0.55;x2=5.5 6.75 7.25 5.50 7.00 6.50 6.75 5.25 5.25 6.00 6.50 6.25 7.00 6.90 6.80 6.80 7.10 7.00 6.80 6.50 6.25 6.00 6.50 7.00 6
12、.80 6.80 6.50 5.75 5.80 6.80;y=7.38 8.51 9.52 7.50 9.33 8.28 8.75 7.87 7.10 8.00 7.89 8.15 9.10 8.86 8.90 8.87 9.26 9.00 8.75 7.95 7.65 7.27 8.00 8.50 8.75 9.21 8.27 7.67 7.93 9.26;X=ones(30,1) x1 x2 (x2.2);b,bint,r,rint,stats=regress(y,X);rcoplot(r,rint)附录 2: (1). x1=-0.05 0.25 0.60 0.00 0.25 0.20
13、0.15 0.05 -0.15 0.15 0.20 0.10 0.40 0.45 0.35 0.30 0.50 0.50 0.40 -0.05 -0.05 -0.10 0.20 0.10 0.50 0.60 -0.05 0.00 0.05 0.55;x2=5.5 6.75 7.25 5.50 7.00 6.50 6.75 5.25 5.25 6.00 6.50 6.25 7.00 6.90 6.80 6.80 7.10 7.00 6.80 6.50 6.25 6.00 6.50 7.00 6.80 6.80 6.50 5.75 5.80 6.80;x3=x2.2; y=7.38 8.51 9.
14、52 7.50 9.33 8.28 8.75 7.87 7.10 8.00 7.89 8.15 9.10 8.86 8.90 8.87 9.26 9.00 8.75 7.95 7.65 7.27 8.00 8.50 8.75 9.21 8.27 7.67 7.93 9.26;X=ones(30,1) x1 x2 x3;b,bint,r,rint,stats=regress(y,X)7b =17.32441.3070-3.69560.3486bint =5.7282 28.92060.6829 1.9311-7.4989 0.10770.0379 0.6594r =-0.0988-0.0795-
15、0.1195-0.04410.4660-0.01330.29120.2735-0.23510.1031-0.40330.17470.0400-0.15040.12840.1637-0.0527-0.1907-0.0870-0.0165-0.1292-0.3002-0.2933-0.1679-0.21770.11160.30350.069380.24740.2270rint =-0.5270 0.3294-0.5309 0.3718-0.5106 0.2716-0.4731 0.38480.0813 0.8507-0.4609 0.4343-0.1374 0.7197-0.0870 0.6340
16、-0.5960 0.1258-0.3280 0.5341-0.8190 0.0125-0.2618 0.6112-0.4032 0.4832-0.5933 0.2925-0.3207 0.5775-0.2841 0.6116-0.4830 0.3776-0.6248 0.2434-0.5348 0.3609-0.4423 0.4092-0.5609 0.3024-0.7181 0.1177-0.7243 0.1377-0.5548 0.2190-0.6449 0.2095-0.2994 0.5226-0.1037 0.7106-0.3714 0.5099-0.1807 0.6755-0.189
17、0 0.6430stats =0.9054 82.9409 0.0000 0.04909(2).x4=x1.*x2x4 =-0.27501.68754.350001.75001.30001.01250.2625-0.78750.90001.30000.62502.80003.10502.38002.04003.55003.50002.7200-0.3250-0.3125-0.60001.30000.70003.40004.0800-0.325000.29003.7400 X=ones(30,1) x1 x2 x3 x4;b,bint,r,rint,stats=regress(y,X)b =29
18、.113311.1342-7.6080100.6712-1.4777bint =13.7013 44.52521.9778 20.2906-12.6932 -2.52280.2538 1.0887-2.8518 -0.1037r =-0.0441-0.12290.0299-0.07450.3841-0.04720.23310.0287-0.06610.0297-0.43720.17630.0356-0.13820.10270.12700.0048-0.1435-0.10160.0050-0.0389-0.1334-0.3272-0.3274-0.21020.14120.32500.10960.
19、2342110.2455rint =-0.4425 0.3542-0.5408 0.2951-0.3101 0.3698-0.4736 0.32470.0245 0.7437-0.4640 0.3695-0.1674 0.6337-0.2369 0.2943-0.3751 0.2430-0.3691 0.4284-0.8118 -0.0627-0.2306 0.5832-0.3788 0.4499-0.5521 0.2757-0.3172 0.5226-0.2917 0.5456-0.3944 0.4039-0.5490 0.2621-0.5193 0.3160-0.3926 0.4026-0.4360 0.3582-0.5045 0.2378-0.7212 0.0667-0.6326 -0.0221-0.6085 0.1881-0.2398 0.5223-0.0484 0.6984-0.2988 0.5181-0.1650 0.6335-0.1391 0.6302stats =0.9209 72.7771 0.0000 0.0426参考文献:数学建模