1、数学、模型与数学建模,孟大志 北京工业大学,应用数理学院教授 山科大信息科学与工程学院特聘教授 Tel: 15192569498,未知者的发问,回答只要给出例子 中小学生初等数学: 自然数的记数和计算、算术; (上帝造了自然数,其他都是人造的!) 平面和立体几何; (古埃及人的测量学) 代数:关于字母的算术; (人类逻辑思维的抽象),1.简单问题:数学是什么?,一、什么是数学?为什么有普适性?,大学生(三高,二十世纪以前的古典数学): 高等解析几何; 高等代数(多项式理论和线性代数); 高等数学(数学分析或微积分)最具抽象思维的数学,来源于实际计算:,近代数学基础(新三高,二十世纪的数学),
2、近世代数(抽象代数):关于群、环、域的理论,研究的是这些代数结构。,拓扑学:系统研究始于Poincare的组合拓扑和Hausdorff的点集拓扑,20年代成熟。,泛函分析:二十世纪最具综合性的、广泛应用的数学基础学科:几何观点加代数方法的分析理论。,数学=集合+结构,N.Bourbaki的结构主义学派, 发起:嘉当、韦伊、迪多涅、谢瓦莱,数学是什么?数学家的复杂问题,数学基础的三大学派:逻辑主义、直觉主义和形式主义有不同的观点,一个古老的没有标准答案的问题!,初等数学,集合:实数及其初等函数,结构:序结构、代数结构,高等数学,集合:Rn (Cn)、流形及其上的函数,结构:序结构、代数结构、稠密
3、性结构、紧性结构、可分离性结构(Hausdoff公理)、连续性结构、拓扑结构、微分结构、流形的结构以及代数结构。,进一步的问题:什么是结构? 结构 = 集合的子集族,Bourbaki的数学定义: 数学=集合+结构,例 图书馆,字符集:中文字、英文字母、数字等等各种字符的全体。,书、文章、多媒体文本等形成子集族集合的文本结构。,文本按知识类型分类,形成不同层次的子集族 国际图书分类法图书馆的藏书结构专业模型。,2.数学为什么有用?,世界上一切事物都有结构,因此研究抽象结构的科学数学必然到处有用。,但是抽象方法不可滥用!,建筑结构、地质结构、人才结构、市场经济结构、城市规划结构、行政体系结构、人体
4、骨骼结构,等等。 分子生物学:结构决定功能!,对随机拓扑空间 X 中的一个随机函数 f(t) 可以定义 微笑 G(f(t)=0 和烦恼 G(f(t)=1 两种状态。关于随 机函数 I(t) 的状态有如下的判定定理:当在t时刻的一个随机函数 y(t) 属于随机函数 I(t)的 邻域且G(y(t)=0 时必有G(I(t)=1,只要存在另一个随机 函数 S(.) 和时刻 Tt ,使在时刻 T 时,S(T) 属于 I(T) 的邻域且 G(S(T)=0.,“乏味”的数学抽象:听到人家在唱美妙的歌曲:“你来到我身边,/带着微笑,/带来了我的烦恼!/她比你先到。”,数学抽象癖(一个笑话),数学抽象是为什么?
5、,一个有抽象癖的数学家把歌词抽象为一个定理:,突出结构,抽象成形式化的结构 普适应用,数学抽象是为什么?,简化语言,缩短思维路径 实现快速推理,二、什么是模型? 什么是数学模型?,一个例子: 2010年B题上海世博会影响力的定量评估2010年上海世博会是首次在中国举办的世界博览会。从1851年伦敦的“万国工业博览会”开始,世博会正日益成为各国人民交流历史文化、展示科技成果、体现合作精神、展望未来发展等的重要舞台。请你们选择感兴趣的某个侧面,建立数学模型,利用互联网数据,定量评估2010年上海世博会的影响力。,例2、Web中的问题,网络已经成为现代人的一种生活方式。在网上,每天有成千上万的多媒体
6、文件在传输(例如,路透社每天收到网上文本文件达20万)。试建立数学模型,使得可以对这些文件进行自动分类,以便人们阅读和使用。,例3 中国菜系研究,中国是一个美食及其文化非常丰富的国家,因为国土辽阔,人口众多。中国著名的菜系:苏菜、闽菜、川菜、鲁菜、粤菜、湘菜、浙菜、徽菜。 请用数学建模方法研究这些菜系的特点。,如何建模是方法的研究性问题: 数学建模本质上是一个创造性的过程, 如何“创造”是一个科学研究课题。,模型?+ 数学? 数学模型? 如何建模?,问题:如何从数学模型的概念出发构造方法 ?,结构化数学建模方法: 基于创造的本质性的方法。,0、引子:从基本概念的理解出发,1)社会科学模型 经济
7、与管理科学模型、军事模型(越战)、政治模型、社会学模型等等。,1、概念:什么是模型,这是一个通过举例或指认回答的简单问题。,例 项目管理科学中的甘特图模型反映了在项目管理中各个过程的受控运行状态,是项目各部分关联结构的动态表示。,例 选举模型多数选举法、累计选举法等等,是特种社会活动的模型。,这些模型共同特点是: 表达方式易于理解,抽象度低。,例 经济学模型:市场模型、竞争模型、企业战略模型、股票模型、金融模型,等等。,建筑模型 ,交通模型,电路模型,服装模型 等等。 表达:建筑设计图、交通网络、电路图、服装模版等。,2)工程技术模型,3)生命科学模型 新陈代谢模型、光合作用模型、血液循环模型
8、、DNA双螺旋模型 、蛋白质结构模型等等。,用专业理论抽象出的结构: 并用专业语言表示的模型。,5)物理模型 基本粒子、原子模型、晶体模型 、光学的衍射等等。,4)化学模型 苯环 、化学健理论、反应平衡等等;,2、模型是什么?定义!,模型:以特定目的对事物原型抽象出结构并适当表示。,抽象出结构:不是一般概念的抽象,而是结 构的抽象;,适当的表示:使用不同知识与方法,需要不同 的语言表示。,特定目的:目的不同,关注的结构(事物的内部 联系)不同;,例. 飞机模型目标不同,模型不同,目的:空气动力学研究 抽象结构:外型结构,除去内部构造;,目的:机舱设计 抽象结构:内部空间结构,除去外部结构;,不
9、同目的关注的内容不同,抽象的结构不同。,表示:专业图形和航空语言表示。,例. 地图是结构的抽象!,概念的抽象(不是模型!):楼群、居住小区、公共场所与设施、商区、政府机关、河流、湖泊、公交线路、各级公路、快速路、高速路、立交桥等等。,目的:城市交通研究,抽象出结构:小区、商区、立交桥、道路、交叉路口等概念的关联和区分忽略细部特征、概念的部分内涵、人口结构等等。,模型表示:城市交通地图,3、核心是结构,理解原型的结构,抽象并表示结构是核心问题。,例 图书馆,字符集:中文字、英文字母、数字等等各种字符的全体。,书、文章、多媒体文本等形成子集族集合的文本结构。,文本按知识类型分类,形成不同层次的子集
10、族 国际图书分类法图书馆的藏书结构专业模型。,同一个集合,不同结构原型的意义不同。,例 语言,下雨天 留客天 留我不留,下雨天留客 天留我不留,语言的结构不同,含义不同(数据同)。,例.语言的不同结构产生不同的文学信息,唐诗清明时节雨纷纷 路上行人欲断魂 借问酒家何处有 牧童遥指杏花村,宋词 清明时节雨 纷纷路上行人 欲断魂。 借问酒家何处 有牧童 遥指杏花村。,剧本(元曲) 清明时节 雨纷纷 路上 行人(欲断魂): 借问酒家何处有? 牧童 (遥指): 杏花村。,时间 环境 地点 人物 语言 另人物 动作 语言,抽象出结构:,七言唐诗 ,比较规整,适于言志“诗言志”,宋词 ,错落有序,用语活跃
11、,适于抒情“词抒情”,元曲 时间、地点、 情景、人物、 动作、言语 等。用语白话,易懂。,百姓故事,结构的不同表示可以表现出文学基调不同:,用音高表示:,唏 唏 唏 唏,唏啦嫂发米来斗,嫂 啦 米 啦 嫂 米,规则,变化,4、模型抽象度与数学的普适性,1)、科学的依赖序关系与抽象度,这种单调的依赖关系由科学领域的物质组成决定,2)、科学序与物质世界的形成,科学的依存关系:,社会科学由生命体组成,扩展的科学与技术的抽象递减顺序:数学物理化学生物工程技术 社会科学,3)、模型的抽象度依科学序关系递减,模型表示的抽象度依次递减,表现出普适性。,原型:具体的元素与部件 具体的结构,数学:抽象的元素 抽
12、象的结构,数学研究的内容决定了数学的普适性!,5、数学与普适性,四、结构主义数学建模,“定义”: 模型原型结构的恰当表示; 数学:集合+结构,数学是研究结构的, 数学模型:原型结构的数学表示。 “定义” :如何建模?,3)推导模型公式 完善模型的假设,并表示成适定的形式。,4)求解模型 选择正确的解法,特别是数值计算与分析。,5)回答问题 解释数学解,分析鲁棒性和近似假定,确定解对于问题的作用。,2)选择建模方法 利用经验、技巧和文献选择解决问题的求解方法。,1)提出问题 列出所有变量、单位和所有假设,并表示。用数学表达式给出问题的目标。,1、目前的方法,一般建模程序,Mark M. Meer
13、schaert的著作“Mathematical Modeling”中,提出数学建模的五步法:,以上方法并没有解决抽象什么、怎么抽象,“抽象”是最抽象,学生在没有经验的条件下束手无策。,结构化建模方法: 提供分析的方法分析结构的方法, 学习原型结构的表示方法建立专业模型,学习数学结构,产生建模的可操作流程。,2、结构化数学建模程序,数学语言表示的结构,数学模型,专业语言描述结构,专业模型,分析出原型的结构,并用数学语言表示的模型。,一般流程:,有些问题专业模型难,有些问题数学模型难。,对原型确定目的,Web中的问题,网络已经成为现代人的一种生活方式。在网上,每天有成千上万的多媒体文件在传输(例如
14、,路透社每天收到网上文本文件达20万)。试建立数学模型,使得可以对这些文件进行自动分类,以便人们阅读和使用。,五、结构主义建模例子,2010年B题 利用互联网数据,定量评估2010年上海世博会的影响力。,1、在线文本自动分析,原型的目标: 在线电子文本的计算机自动分类与辅助理解。 理解基于分类,分类是理解的主体,理解就是分类!,两类“分类模型”的目标: 检索性分类国际图书分类法,目的是查询;,理解性分类基于语意、概念层、主题层的细分类,目的是分析和理解。,)、建立专业模型,原型的结构分析,文本章节段落语意团 句或短语词字符,文本的结构:,原型有两层结构:文本的结构;文本集合的结构。,分析:文本
15、集合的结构依赖于文本的结构;文本集合的结构是原型对于目的的主要结构;因此文本的结构的表示依赖文本集合的结构。,原型的专业模型(源于关键词和摘要的作用的理解),模型1. 以词频为特征的分类模型,词: 有语意的初级字符串单位语言的细胞;,词在文本中的频率与不同类文本间频率差别是分类的基本特征和基本的结构性差别。,模型2. 以语意团为特征,重在语意差别的分类。,模型3. 混合模型,语言能力模型:乔姆斯基的语法结构模型是另一类语言模型。,文本集的结构分析:分类是在文本的集合中进行,因此是原型的用于分类目标的主要结构。,联想到数学中的结构,例如代数结构,是在集合中定义代数运算加法和数法:元素间的运算关系
16、,两个文本的合并还是文本加法封闭; 一个文本的倍数仍然是文本数乘封闭!,分析文本集的结构,首先是文本之间的相互关系: 两个文本合并是什么?还是文本!,)、同构分析,一个最基本的数学概念线性空间:一个抽象的集合,其中的元素之间定义了两种运算加法和与数的乘法满足: 1)对运算封闭; 2)满足对于运算的8条运算法则。,同构: 此时问题的原型的结构直接和数学结构联系起来! 建立原型结构的数学表示则建立了数学模型。,文本的集合应该有一个“线性空间”的结构; 文本的分类是在线性空间中的“向量的分类”!,具有线性代数的知识,对于线性代数的结构有清楚的理解和关注,则容易发现:,以上分析导至文本向量的概念:,每
17、个文本对应地定义一个文本向量,用于分类,分量如何定义?,显然,分量是“分类特征”的具体表示:,基于词频以及用于区分文本的量化的表示分析!,模型1的数学模型:向量空间的结构+词频特征。,)、同构表示与数学建模,根据专业模型,词频及具有分类的特征信息,因此可以仿照熵的定义:,假设TF(w(i),dj)是词w(i)在文本dj中出现的次数,|D|是D中文本总数,DF(w(i)是指在D中至少出现一次w(i)的文本数。则每一个文本djD,和一个特征词w(i)存在一量:,这里熵的形式,一来用类似信息熵的定义,符合“分类”的特征信息的概念;二来,词频的作用大于词在文本集合中出现的作用。,记d(i)j =TFI
18、DF(w(i),dj) ,则每一个文本djD,存在一个分量适当排序的文本向量:,文本集合的数学模型文本的特征向量空间。 分类问题是N维线性空间的向量的分类问题。,许多方法可以用于求解,例如SVM分类器对于数据压缩很有效。,文本自动分类: 理解文本的类属性,子空间分类. 文本自动聚类: 发现文本集合中的新模式,新概念.,文本向量: 由文本的实意词的特征值或特征模式为分量的向量.以信息熵的形式构造.,特征子空间: 具有某种共同意义的分量组成的子空间.,文本向量空间: 全部文本向量的高维线性空间.,应用事例:思想史研究中,“五四” 运动的讨论的主要思想是什么?,发现在“自由主义”的特征词所在的子空间
19、中,文本的投影数量最大!,例3 中国菜系研究,中国是一个美食及其文化非常丰富的国家,因为国土辽阔,人口众多。中国著名的菜系:苏菜、闽菜、川菜、鲁菜、粤菜、湘菜、浙菜、徽菜。 请用数学建模方法研究这些菜系的特点。,中国淮扬菜肴网 复杂网络,顶点食品 边菜肴中两种食品之间的相互作用 每道菜肴局域世界(完全图) 通过公共顶点连接构成中国淮扬菜肴网。 329道菜肴,242个顶点(食品),1713条边。 完全类似于中药方剂网的讨论。,希望大家喜欢数学, 更喜欢数学建模!谢谢大家!,Watson and Crick,构造DNA双螺旋模型,结构主义建模三讲,第一讲. 概念: 模型、数学模型与数学建模 问题的提出;模型、数学、数学模型和建模的概念;结构化数学建模的概念;例子,第二讲. 理论: 结构主义与数学建模方法 深入结构化建模的理论;皮亚杰的结构主义方法;数学中的结构;结构化建模方法初探,第三讲. 实践: 结构主义建模的研究与教学 结构化建模教学方法讨论;初等与高等数学的结构;实际问题中的结构与表示;研究课题,