1、生物信息学 第八章 数学模型,毛理凯,2,本课目录,概述 差分方程 微分方程 应用 E-Cell,3,一、概述,4,数学模型的例子(米氏方程),酶促反应机制 根据稳态/定态(steady state)假设和反应动力学推导出米氏方程,5,为什么要使用数学模型?,通常利用数学模型来作为所关心的系统工作原理的假设 通过模拟(simulation)的结果可以证明假设是否正确 理解生命现象的机制 正确的模型可以进一步预测生命系统的其他未知特性 预言试验结果,指导实验设计,减少实验成本 善于在短时间内完成复杂的实验,甚至某些当前实验条件尚无法达到的,6,定义、构成元素,数学模型(mathematical
2、model)是用数学语言来描述一个系统的抽象模型 例如一个群体增长模型 这个数学语言通常是包含一些方程 这些方程(equation)用来建立一些变量之间的关系 这些变量(variable)通常代表了系统的某些属性(property) 如某群体的大小,7,构成元素关系,系统,属性,关系/规律,数学模型,变量,方程,8,参数,模型还包括参数(parameter) 参数通常是常数,用于描述系统的某个相对不变的属性 如某群体的生殖率(以群体大小为变量) 参数在模型中相对于变量为从属地位 一个属性是变量还是参数没有明显界限,由具体问题的性质决定 如果以生殖率为研究对象(变量),那么生殖率就不是参数,而是
3、变量,9,数学模型的分类(1),静态的(static)和动态的(dynamic) 区别在于是否考虑时间 动态模型常由差分方程或微分方程来表示 确定性的(deterministic)和随机性的(stochastic) 看是否唯一参数决定唯一结果 注意: 确定性模型可能产生貌似随机的结果,如混沌(chaos),10,数学模型的分类(2),(时间)离散的(discrete)和连续的(continuous) 如差分方程(离散)和微分方程(连续) 线性(linear)和非线性的(nonlinear) y=ax+b (线性) y=ax2+bx+c (非线性) 对于方程组来说,只有全部方程都是线性的,该模型
4、才是线性模型,11,数学模型的分类(3),集总/中(lumped)参数和分布(distributed)参数模型 看参数是(集总)否(分布)均一分布 分布参数模型常用偏微分方程表示,12,一个离散模型的具体例子,生命游戏(life game) 属于细胞自动机(cellular automaton)的一种 给定某初始条件和繁衍条件 根据这些条件,观察群体的演化 定态,周期解,混沌 演示,13,二、差分方程 (difference equation),14,例: 逻辑斯蒂映射(logistic map),方程 Xn+1=rXn(1-Xn) Xn是变量,范围0,1,代表某群体中第n代的个体数(已归一化
5、) r是参数,表示增长率 如果知道前一项Xn,我们就可以推出后一项Xn+1 所以差分方程也叫递归(recursion),15,解差分方程,要解这个差分方程,或者说进行模拟(run a simulation), 需要知道参数值(parameter values)、(变量)初值(initial values) 令 r = 1.0X0 = 0.5 这样可以通过迭代(iteration)来求解差分方程,16,不同参数的效果(1),周期一,周期一,周期二,17,不同参数的效果(2),混沌(Chaos),周期四,18,迭代,对于本例(参数r=1.0) X0=0.5 X1=0.25 X2=0.1875 X3
6、=0.152344 X4=0.129135 X5=0.112459 X6=0.099812 ,用Excel操作、三维演示,19,换个方式演示迭代过程,用笔和尺,20,混沌的初值敏感性(sensitivity to initial conditions),21,分岔图(bifurcation diagram),就是横轴为参数、纵轴为变量的图,显示整个系统随参数的变化,22,丰富多彩的分岔图 前分岔、后分岔,后分岔(r0),前分岔(r0),23,丰富多彩的分岔图 自相似,前分岔局部放大,程序、动画演示,24,丰富多彩的分岔图 三维,前后分岔、r为复数,25,三、微分方程 (differential
7、 equation),26,(微分基础)微分/导数就是速度,从导数的定义开始,x0,导数表示在x的某一点的切线的斜率,也就是变化率,变化率就是速度,27,两种主要的微分方程,常微分方程(ordinary differential equation)u是x的函数(都是变量) 该方程的解为u(x)=c c为任意常数,28,两种主要的微分方程,偏微分方程(partial differential equation)u是x,y的函数 该方程暗示u独立于x 所以该方程的解为u(x,y)=f(y) f是y的任意函数,29,(生态学例子)群体增长模型(1),方程x是变量,代表某群体的个体数,即该群体大小,对
8、时间t求导 m是参数,表示增长率 求导表示上变量对下变量变化的速度,所以这里的求导代表某群体大小的变化速度,30,群体增长模型(2),这样上述方程就表示某群体的增长速度跟现有的群体大小成正比(这意味着指数增长!) 该方程其实就是著名的马尔萨斯人口方程,m是马尔萨斯参数(Malthusian parameter),31,群体增长模型(3),该方程的(解析)解(analytic solution)是,m=1, x0=1,32,(混沌例子)Lorenz奇怪吸引子,微分方程也可以产生混沌!而且更漂亮! 例如Lorenz奇怪吸引子(strange attrator),33,微分方程的数值解,这个方程不易
9、得出解析解 需转化成差分方程并借助计算机求得数值解(numerical solution) 欧拉折线法(Euler method)dy/dx=f(x,y)(yn+1-yn)/h=f(xn,yn)yn+1=yn+h f(xn,yn) 转化成了差分方程 用Excel也可以解(演示)!,34,用软件Euler解Lorenz方程,Euler 免费Matlab克隆 几乎可做常见的任何数学操作,甚至可以符号运算! 2M! Homepage 演示,35,(例子)Logistic映射的微分形式(单物种增长),差分 Xn+1 = rXn(1-Xn) 微分 dX/dt = rX(1-X/K) X : 群体大小(变
10、量) t : 时间 r : 增值率(参数) K : 群体大小极限(参数) 该方程比Malthus模型更接近现实,考虑了资源限制,36,单物种增长模型的解,变量初值 X0=1 参数值 (变化) r=1 (110) K=10000 (100010000) Euler演示解的演化、解受参数的影响 不再指数增长(资源限制K起作用了!) 还不如差分方程的解丰富 只有定态解(steady states, fixed points, equilibria),37,定态解及其稳定性,令方程右边rX(1-X/K)=0,即可得定态解 X1=0, X2=K 求这些定态解的稳定性(stability) 对方程右边求导
11、 rX(1-X/K)=r-2rX/K 将定态解代入 r-2rX1/K=r 0 X1不稳定 不可见 r-2rX2/K=-r 0 X2稳定 可见,38,丰富多彩的混沌,分形学,39,Dynamics Solver,免费数学运算、作图软件 特别擅长于非线性动力学、混沌、分形 7M 软件自带混沌示例 bifurcation.ds (Logistic) circle.ds, Crutchfield.ds, tent.ds (不同的分岔图) Henon4.ds (初值敏感) Henon1.ds, baker.ds, Lozi.ds, Julia.ds, Mandelbrot.ds, Newton.ds,
12、von Koch.ds, snowflake.ds, tree.ds (自相似,丰富的细节,分形),40,四、应用,41,应用广泛(仅生命科学方面的部分列举),生态学 捕食-被捕食模型 酶动力学(生化) 米氏方程 神经系统 细胞代谢系统 信号转导系统 传染病 群体遗传学,42,群体遗传学 模拟突变,研究对象/假设 代与代不重叠,随机交配,群体无限大 1个位点,2个等位基因(A1, A2),pn和qn=1-pn是它们在第n代时的基因频率 A1变异为A2的突变率是u,A2变异为A1的突变率是v 设一代中一个等位基因只能变异一次,A1,A2,u pn,v qn,43,这样下一代的A1为 pn+1=(
13、1-u)pn+v(1-pn) 这个差分方程的解为这里p0是开始时(第0代)A1的频率 通常u, v很小(10-6或10-5的量级) 当n, pnv/(u+v), qnu/(u+v) 达到平衡(实际很难达到),突变方程及其解,44,predator-prey模型,Malthus和Logistic模型是单物种模型 predator-prey模型是一类双物种模型 Predator: 捕食者 Prey: 被捕食者,45,Lotka-Volterra模型,Lotka-Volterra模型是最早的predator-prey模型 美生物物理学家Alfred Lotka (1925) 意数学家Vito Vol
14、terra (1926) 基于一阶非线性常微分方程,捕食者,被捕食者,Euler数值解演示,46,定态解,求定态解 -x-xy=0 -xy-y=0 得 x=y=0 (定态解1) x=/, y=/ (定态解2),47,定态解的稳定性,用偏导数线性化方程右端 得Jacobian matrix该矩阵的本征值(eigenvalue)是1=0, 2 =-0, 2 =-i0 (定态解2) 该定态解是焦点(focus, 稳定周期),48,五、E-Cell,49,E-Cell简介,功能: 在分子水平上全细胞模拟 免费/Gnu General Public License (GPL)、开源 跨平台(Linux, Windows, Mac) 程序架构: 前端/界面python,核心C+ 支持各类数学模型,参数估计,分析,便于自动化 E-Cell 3D (for Mac) 演示,50,考试,不定项选择题 30 (15) 是非题 30 (15) 名词解释题 20 (5) 综合分析题 20 (2),51,完,