1、数学建模思想方法大全及方法适用范围主讲人:厚积薄发(冰强,Bruce Jan) 数学中国社区- 专业的数学建模网站第一篇:方法适用范围 3 ? m q% k9 N( t4 M8 |; M分为两类:多元线性回归和非线性线性回归;其中非线性回归可以通过一定的变化转% ( - 化为线性回归,比如:y=lnx 可以转化为 y=u u=lnx 来解决;所以这里主要说明多元线性( M1 L回归应该注意的问题。3、注意事项在做回归的时候,一定要注意两件事:(1) 回归方程的显著性检验(可以通过 sas 和 spss 来解决)(2) 回归系数的显著性检验(可以通过 sas 和 spss 来解决) 3 u4 F
2、: i. d T7 a0 9 E* f( U, 2 j0 w检验是很多学生在建模中不注意的地方,好的检验结果可以体现出你模型的优劣,是完整论文的体现,所以这点大家一定要注意。$ b- . l) p# F+ o ) f u4、使用步骤:. i: L! U6 W! v8 w5 g(1)根据已知条件的数据,通过预处理得出图像的大致趋势或者数据之间的大致关系;(2)选取适当的回归方程;(3)拟合回归参数;(4)回归方程显著性检验及回归系数显著性检验 7 n/ C+ u# y- q(5)进行后继研究(如:预测等)4 M7 j2 W% T $ a9 a1.2 聚类分析1、方法概述: F e5 r% V5
3、S, S0 T! s该方法说的通俗一点就是,将 n 个样本,通过适当的方法(选取方法很多,大家可以自行查找,可以在数据挖掘类的书籍中查找到,这里不再阐述)选取 m 聚类中心,通过研究- 各样本和各个聚类中心的距离 Xij,选择适当的聚类标准,通常利用最小距离法(一个样本归于一个类也就意味着,该样本距离该类对应的中心距离最近)来聚类,从而可以得到聚类. 结果,如果利用 sas 软件或者 spss 软件来做聚类分析,就可以得到相应的动态聚类图。这种模型的的特点是直观,容易理解。$ u% + f0 F x ?! T; y3 B聚类有两种类型:(1) Q 型聚类:即对样本聚类; / q/ e“ 0 s
4、7 r3 C. a* M2 (2) R 型聚类:即对变量聚类; U) w+ Q0 D* J6 N |) (2) 距离法聚类方法:* D) v* s- e: V P(8) 利差平均和法在具体做题中,适当选区方法;3、注意事项+ V% T; ?! _) U3 R: X0 h在样本量比较大时,要得到聚类结果就显得不是很容易,这时需要根据背景知识和相关( G的其他方法辅助处理。4、方法步骤(1)首先把每个样本自成一类;(2)选取适当的衡量标准,得到衡量矩阵,比如说:距离矩阵或相似性矩阵,找到矩/ G! A. “ i! ? G. p“ k 阵中最小的元素,将该元素对应的两个类归为一类,9 T! K. F
5、- v“ Z W# u9 C# X+ 1 - V( k+ w(3)计算实际输出值(4)计算实际输出值和期望输出值之间的误差) i2 I0 r1 ?! # G3 S(5)用误差去修改权系数 3 r+ U6 G3 M% X$ K k( b3 l. 7 L(6)判断是否满足终止条件,如果满足终止,否则进入第二步 j3 * F! Q* K5 f5 X! O$ U1 y# q1.4 判别分析1、概述 1 p* N1 L# O6 H9 T7 7 ?其是基于已知类别的训练样本,对未知类别的样本判别的一种统计方法,也是一种有监 0 d1 v3 N6 P7 X 督的学习方法,是分类的一个子方法!具体是:在研究已
6、经过分类的样本基础上,根据某些判别分析方法建立判别式,然后对未知分类的样本进行分类!2、分类* D! o: G( N6 o, 3 5 m根据判别分析方法的不同,可分为下面几类:$ D0 I* E$ j/ H% (1) 距离判别法(2) Fisher 判别法(3) Bayes 判别法, U( m) P3 e$ M. X. S+ b“ X(4) 逐步判别法关于这几类的方法的介绍,大家可以参考多元统计学 ,其中比较常用的是 bayes 判 2 R$ R/别法和逐步判别法3、注意事项:判别分析主要针对的是有监督学习的分类问题。共有四种方法,这里重点注意其优缺点:0 7 (1) 距离判别方法简单容易理解
7、,但是它将总体等概率看待,没有差异性;2 H- A; V/ U$ b! ; o: Z, o主成分分析是一种降维数的数学方法,具体就是,通过降维技术奖多个变量化为少数几个主成分的统计分析方法。在建模中,主要用于降维,系统评估,回归分析,加权分析等等。“ J1 Y$ D; C T9 B L0 b+ O( D6 t, F明出现在可观察变量中的相关模型(有点类似于前面讲述的分类和聚类的区别)9 j3 m q2 L7 q3 “ 提供了一种有效的利用数学模型来解释事物之间的关系,体现出数据挖掘的一点精神!他可以用来解决降维,系统评估,加权分析等方法。2、分类因子分析是 R 型,即对变量研究 “ ?* u.
8、 L, n4 Q$ q$ y d- R! 3、注意事项( c9 r9 J; f“ E3 f b1、概述在实际问题中,由于观察人员的粗心或偶然因素的干扰。常会使我们所得到的数据不完“ C7 p; 全可靠, 即出现异常数据。有时即使通过相关系数或 F 检验证实回归方程可靠,也不能排除数据存在上述问题。残差分析的目的就在于解决这一问题。所谓残差是指实际观察值与回归估计值的差。2、分类无3、应用(1)通过残差分析来排除异常数据(2)通过残差分析来检验模型的可靠性 5 a$ R _- D w2、分类 V3 L# L. M4 X2、分类% |4 4 / _; 0 方法分类: ) k# W5 O$ q5 V
9、* V+ e j(1) 平均数预测(简单算术平均法,加权算术平均法,几何平均数法). ? L i$ C# x(2) 移动平均数预测(一次移动平均法,二次移动平均法): k% E1 q X0 y(5) 季节变动法(简单平均法,季节比例法)- L. h: u3 m8 3注意事项(1)季节变动法预测需要筹集至少三年以上的资料+ X! ) 9 E: Q- P9 v: ) j(2)移动平均法在短期预测中较准确,长期预测中效果较差;(3)移动平均可以消除或减少时间序列数据受偶然性因素干扰而产生的随机变动影响。- U; X; X L4 h- j! |(4)一次移动平均法适用于具有明显线性趋势的时间序列数据的
10、预测;一次移动平均法只能用来对下一期进行预测,不能用于长期预测,必须选择合理的移动跨期,跨期越* r! J4 d3 W u1 Q9 Z4 $ k大对预测的平滑影响也越大,移动平均数滞后于实际数据的偏差也越大。跨期太小则又不能有效消除偶然因素的影响。跨期取值可在 320 间选取。(5)二次移动平均法与一次移动平均法相比,其优点是大大减少了滞后偏差,使预测 8 s; 8 P* f y. C1 M(6)最小二乘法即适用于直线趋势的预测,也适用于曲线趋势的预测。还有一些注意事项,这里就不在意义罗列4方法步骤$ o F4 6 _6 U, c; E* ( F4 v(略)- Z2 k/ E, U% p4 t
11、, |统计学的分析方法到这先告一段落! Q8 A5 q7 v: N( W下面进入优化的方法介绍:二、优化方法 5 c O- S3 % G! I1 E- S# D# O(2)多目标规划可以通过适当的方法转化为但目标规划来解决(3)非线性规划,在一定的条件下,可以近似为线性规划来解决 3 c# |- r$ y) d) k1 w. G: O+ h(4)不确定性规划可以通过适当的技巧转化为确定性方法解决* n1 A( x2 q. N8 P9 a1 E这些转化,大家可以参阅优秀论文,注意学取人家的经验,从而建立自己的能力提升!也可以参考相关优化书籍和运筹学书籍来学习,书上都有介绍!, , _ 8 : q
12、4、步骤 8 l d4 % k4 S6 / g% k. e# 简要概括- N4 S$ O: 0 y! - s; a0 K$ m% Y(1)建立规划模型(2)选择方法 2 i- s! O, U3 z“ h0 f W n(3)结果解释 2 S6 U; 3 t1 4 y, U ; S: M三、排队论1.概述 7 ( k o0 v; T- l( N8 4 . |在我们的生活中,经常会做和排队想关的事情,比如:银行等待取钱,医院挂号排队,理发排队等等,都会涉及到排队问题,并且 2009 年国赛 B 题第五小题就考了和排队论相关的问题。排队论是一门研究拥挤现象的学科,具体就是研究各种排队系统概率基础上,解
13、决相应 3 |% d“ I7 的排队系统的最优设计和最优控制问题(注意:其实解决排队最优设计和最优控制的问题)2、分类/ G- g9 e( p; H) D2 (1)泊松输入-指数服务排队模型 3 C3 K+ a% / U5 l7 C(2)M/M/1 等待排队模型 9 N y a( Z5 L) C- U x(1)排队系统常见的优化问题在于A)确定最优服务率/ D/ ; N3 n9 Z b)确定最佳服务台数量c)选择最为合适的服务规则d)确定上述几个量的最优组合(2)在使用时候,应该注意模型的选择,模型选择好后,注意顾客到达和服务时间分布的选择和检验4、步骤(略)四:智能算法的优化应用* P7 H
14、% o( . m( u# i( o1 遗传算法,蚁群算法,贪婪算法,模拟退火算法,回溯法,分支定界法,禁忌搜索算法,: n; 粒子群算法等启发式算法这类算法在实际中应谨慎使用,固然这类算法有其好处,但是其不确定远远大于其确定性,所以大家在比赛中慎重使用,最好使用成熟的算法!五、微分建模 |+ V“ 0 b L6 h7 _! c% H1、使用背景介绍我们通常会在研究一些问题时候,涉及到某些变量的变化率或导数,这样所得到的变量之间的关系就是微分方程模型,其反映的是变量之间的间接关系,通过求解方程,就可以得 2 t# q$ c* S 2 8 p4 I# + sC、模拟近似(2)几种常见的微分方程模型
15、:人口增长模型,传染病模型,捕鱼模型等4、步骤(略)2 r+ q a; F1 4 B- z. x3 ?# 1 B: 六、差分方程1、使用背景的介绍它是研究离散变量的变化规律,具体就是:根据实际的规律性质,平衡关系等,建立离散变量所满足的平很关系式,从而建立差分方程模型。通过求出和分析解,研究方程解的性 2 O9 p6 g2 w7 o E5 - A质,比如,平稳性,渐进性,振动性,周期性等等2、分类几个重要的差分方程模型:1 c) a/ m Y5 e7 I商业贷款,离散形式的人口模型,汽车租赁,动物养殖问题等经典模型,大家可以+ - c S; h2 n,参考,然后对差分方程模型有个全面的认识%
16、+ ! t9 C0 _! 七、图论 7 Z% ) Z+ S8 w1 P6 i0 Z由于图论设计的内容比较多,系统庞杂,而且模型比较灵活,所以在这里不做介绍,大家可以自行研究。; W% c9 g, L0 $ 八、其他方法介绍) k+ 1 N. a! O6 U, S3 ! w7 t灰色系统主要用来解决少数据的预测问题;层次分析法主要用来解决综合分析类的问题;模糊数学可以用来做模糊综合评判,模糊聚类分析和模糊线性规划;蒙特卡洛方法主要: 9 w9 p# j. s# m4 F* _! r: w5 Q是一种计算机仿真方法,通常在排队论问题使用;神经网路可以用来分类,预测,建立模型等等;还有一些其他的方法
17、,这里就不一一介绍了。 O) b! ?/ t2 c# j这里我再补充一点:预测方法的比较:一般小样本内部预测用插值和拟合,大样本内部预测用回归模型。移动平均法属于时间序列分析的内容,时间序列分析一般用作大样本外部预测,就是对未来的预测,灰色理论用于小样本的外部预测,神经网络用于超大样本的未来预测。可以把这些预测方法归纳一下,对于建模,主要考虑这些方法的适用性。上面主要是对建模方法的使用范围做了一定的介绍,关于数学建模中的思想方法大全 ,大家可以参考数学建模中的思想方法大全l- z1 s- P/ T第二篇数学建模思想方法大全在数学建模中常用的方法:类比法、二分法、量纲分析法、差分法、变分法、图论
18、法、层次“分析法、数据拟合法、回归分析法、数学规划(线性规划,非线性规划,整数规划,动态规划,目标规划) 、机理分析、排队方法、对策方法、决策方法、模糊评判方法、时间序列方法、灰色理论方法、现代优化算法(禁忌搜索算法,模拟退火算法,遗传算法,神经网络) 。*用这些方法可以解下列一些模型:优化模型、微分方程模型、统计模型、概率模型、图论模型、决策模型。拟合与插值方法(给出一批数据点,确定满足特定要求的曲线或者曲面,从而反映对象整体的变化趋势): matlab 可以实现一元函数,包括多项式和非线性函数的拟合以及多元函数的; l l 拟合,即回归分析,从而确定函数; 同时也可以用 matlab 实现
19、分段线性、多项式、样条以及多维插值。. k; h% M: Q) g0 C/ G, 在优化方法中,决策变量、目标函数(尽量简单、光滑) 、约束条件、求解方法是四个关键因素。其中包括无约束规则(用 fminserch、fminbnd 实现)线性规则(用 linprog 实现)非线性规则、 ( 用 fmincon 实现)多目标规划(有目标加权、效用函数)动态规划(倒向和正向)整数规划。回归分析:对具有相关关系的现象,根据其关系形态,选择一个合适的数学模型,用来近似地表示变量间的平均变化关系的一种统计方法(一元线性回归、多元线性回归、非线性回归) ,回归分析在一组数据的基础上研究这样几个问题:建立因变
20、量与自变量之间的回归模型(经验公式) ;对回归模型的可信度进行检验;判断每个自变量对因变量的影响是否显著;判断回归模型是否适合这组数据;利用回归模型对进行预报或控制。相对应的有线性回归多元二项式回归、非线性回归。逐步回归分析:从一个自变量开始,视自变量作用的显著程度,从大到地依次逐个引入回归(方程:当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉;引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步;对于每一步都要进行值检验,以确保每次引入新的显著性变量前回归方程中只包含对作用显著的变量;这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为
21、止。 (主要用SAS来实现,也可以用 matlab 软件来实现) 。4 j8 N2 “ c- q U$ J+ e聚类分析:所研究的样本或者变量之间存在程度不同的相似性,要求设法找出一些能够度量它们之间相似程度的统计量作为分类的依据,再利用这些量将样本或者变量进行分类。系统聚类分析将 n 个样本或者 n 个指标看成 n 类,一类包括一个样本或者指标,然后将性质最接近的两类合并成为一个新类,依此类推。最终可以按照需要来决定分多少类,每类有多少样本(指标) 。8 O- c3 o3 C“ h3 Q* c$ 4 D系统聚类方法步骤:1. 计算 n 个样本两两之间的距离2. 构成 n 个类,每类只包含一个
22、样品 5 |5 v* 6 x: Z“ k* f3. 合并距离最近的两类为一个新类, x! Z) _ T; z3 s# i5 X8 N7 I4. 计算新类与当前各类的距离(新类与当前类的距离等于当前类与组合类中包含的类! * X p2 A. m的距离最小值) ,若类的个数等于 1,转 5,否则转 3: A, w0 D3 Z( Q5 ? f0 T0 P; d: K+ M# v判别分析:在已知研究对象分成若干类型,并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。距离判别法首先根据已知分类的数据,分别计算各类的重心,计算新个体到每类的距离,
23、确定最短的距离(欧氏距离、马氏距离)7 n* d! x3 F L( KFisher 判别法利用已知类别个体的指标构造判别式(同类差别较小、不同类差别较大) ,按照判别式的值判断新个体的类别Bayes 判别法计算新给样品属于各总体的条件概率,比较概率的大小,然后将新样品判归+ I. 5 j2 c6 ; Y m) Q9 分析根据研究对象本身的属性构造模糊矩阵,在此基础上根据一定的隶属度来确定其分类% 5 B9 H% l# 5 j关系;模糊层次分析法两两比较指标的确定;模糊综合评判综合评判就是对受到多个因素制约的事物或对象作出一个总的评价,如产品质量评定、科技成果鉴定、某种作物种植适应性的评价等,都
24、属于综合评判问题。由于从多方面对事物进行评价难免带有模糊性和主观性,采用模糊数学的方法进行综合评判将使结果尽量客观从而取得更好的实际效果。8 o- f( D7 d5 n. D/ b: R时间序列是按时间顺序排列的、随时间变化且相互关联的数据序列通过对预测目标自身时: D; N0 A D9 A2 j间序列的处理,来研究其变化趋势(长期趋势变动、季节变动、循环变动、不规则变动)自回归模型:一般自回归模型 AR(n) 系统在时刻 t 的响应 X(t) 仅与其以前时刻的响应X(t-1),, X(t-n)有关,而与其以前时刻进入系统的扰动无关;移动平均模型 MA(m)系统 1 z4 i! v% l8 y
25、( b2 a3 a在时刻 t 的响应 X(t) ,与其以前任何时刻的响应无关,而与其以前时刻进入系统的扰动a(t-1),a(t-m)存在着一定的相关关系;自回归移动平均模型 ARMA(n,m)系统在时刻 t 的响应 X(t),不仅与其前 n 个时刻的自身值有关,而且还与其前 m 个时刻进入系统的扰动存在 / Z* x d7 c一定的依存关系。. G+ |9 V: % ; R5. 检查远端时刻的系数值的值是否很小,其置信区间是否包含零。若不是,则适用的! K1 T. _$模型就是 ARMA(2n,2n-1) 。若很小,且其置信区间包含零,则拟合 ARMA(2n-1,2n-2) 。 M8 6. 利
26、用 F 准则检验模型 ARMA(2n,2n-1)和 ARMA(2n-1,2n-2) ,若 F 值不显著,转入第7 步;若 F 值显著,转入第 8 步。7. 舍弃小的 MA 参数,拟合 m2n-2 的模型 ARMA(2n-1,m) ,并用 F 准则进行检验。1 2 R* U; 1 o z3 b, ?# q最小费用最大流问题:在运输问题中,人们总是希望在完成运输任务的同时,寻求一个使总的运输费用最小的运输方案在数学建模中常用的算法:7 s0 E % z i2 r4 S1:蒙特卡罗算法;2:数据拟合、参数估计、插值等数据处理算法(常用 matlab 实现) ; U. S# G( “ 6 P H+ z- , E S- W# Q8:连续数据离散化;9:数值分析算法;+ n5 M8 y7 g8 z10:图象处理算法(常用 matlab 来实现) 。