1、第三章 效用函数,广西大学数学与信息科学学院 运筹管理系,3.1 理性行为公理,问题:某公司拟推出一种新产品,经预测该产品在市场看好的情况下,可以获利10万;在市场前景较差时,将亏损1万元。市场看好和较差的概率分别为0.6和0.4,是否推出该新产品?若另有一产品可稳获利2万元,推出哪种产品更好?这是一个随机决策问题。,3.1 理性行为公理,在随机决策中,决策系统(,A,F)中的决策方案均是在状态空间背景中加以比较,并按照某种规则,选出决策者最满意的行动方案。在本章中,我们用事态体表示在随机性状态空间中的行动方案,方案的比较表示为事态体的比较,并引入效用的概念,用以衡量事态体(行动方案)的优劣。
2、,3.1 理性行为公理,3.1.1 事态体及其关系 1事态体的概念 定义3.1 具有两种或两种以上有限个可能结果的方案(或事情),称为事态体。事态体中各可能结果出现的概率是已知的。事态体即随机性状态空间中的行动方案。,1事态体的概念,设某事态体的n个可能结果为:o1, o2, , on各结果出现的概率是相应为:p1, p2, , pn 则该事态体记为:T(p1, o1;p2, o2 ;pn, on) 特别当n 2时,称 T为简单事态体,此时T(p, o1;1p, o2 ),1事态体的概念,事态体可以用树形图表示如下:,当n 2时:,p,事态体集合的性质,在凸线性组合下,是闭集。即:若T1,T2
3、,则当01时,有T1 (1)T2两个事态体的凸线性组合仍是一个事态体。T(0, o1;0, o2 ;1, oj ;0, on)称T为退化事态体。退化事态体仍属于事态体集合。,2事态体的比较,定义3.2 设o1,o2是事态体T的任意两个结果值,根据决策目标和决策者偏好,o1和o2有如下关系: 若偏好结果值o1,则称o1优于o2,记作o1o2;反之,称o1劣于o2,记作o1 o2。 若对结果值o1, o2无所偏好,则称o1无差异于o2,记作o1 o2。 若不偏好结果值o1,则称o1不优于o2,记作 o1o2 ;反之,称o1不劣于o2,记作o1 o2 。,2事态体的比较,定义 3.3 设两个简单事态
4、体 T1,T2具有相同的结果值 o1,o2,即 :T1(p1, o1;1p1, o2 )T2(p2, o1;1p2, o2 )并假定o1o2,则: 若p1p2,称事态体T1无差异于T2,记作T1T2 。 若p1p2,称事态体T1优于T2,记作T1T2;反之,称事态体T1劣于T2,记作T1 T2。,2事态体的比较,定义 3.4 设两个简单事态体 T1,T2仅具有一个相同结果值,另一个结果值不相同,即 :T1(p1, o1;1p1, o0 )T2(p2, o2;1p2, o0 )且o2 o1 o0, 若p1p2,则事态体T2优于T1,记作T2T1 。 若T1T2 ,则必有p1p2 。,3.1 理性
5、行为公理,3.1.2 理性行为公理 公理3.l(连通性,可比性)事态体集合上事态体的优劣关系是连通的。即若 T1,T2则或者T1T2 ,或者T2T1 ,或者T1T2 ,三者必居其一。表示任意两个事态体都是可以比较其优劣的!,3.1 理性行为公理,3.1.2 理性行为公理 公理3.2(传递性)事态体集合上事态体的优劣关系是传递的。即若 T1、T2 、T3,且T1T2 ,T2T3 ,则必有 T1T3 。表示任意多个事态体的优劣是可以排序的 (若有些事态体无差异,可排在同一位置。)满足公理3.1和公理3.2的事态体集合称为全序集。,3.1 理性行为公理,3.1.2 理性行为公理 公理3.3(复合保序
6、性,替代性)若 T1,T2 ,Q,且0p1,则T1T2 当且仅当 pT1 (1p)Q pT2 (1p)Q 。表示任意事态体的优劣关系是可以复合的,复合后的事态体保持原有的优劣关系不变。,3.1 理性行为公理,3.1.2 理性行为公理 公理3.4(相对有序性,连续性,偏好的有界性)若 T1,T2 ,T3,且T1T2 T3 则存在数 p,q,0pl,0q1,使得: pT1 (1p)T3 T2 qT1 (1q)T3 表示任意事态体都不是无限优,也不是无限劣。,3.1 理性行为公理,3.1.3 事态体的基本性质 性质3.1设事态体 T1(p, o1;1p, o0 )T2(x, o2;1x, o0 )且
7、 o1o0 , o2o0 ,若o2o1 则存在 x=pp使得 T1T2 称x为可调概率值。,3.1 理性行为公理,3.1.3 事态体的基本性质 性质3. 2(确定当量和无差异概率)设事态体T(x, o1;1x, o2 )且o1o2 。则对于满足优劣关系o1o o2的任意结果值o,必存在xp(0pl),使得T(p, o1;1p, o2 ) o称结果值o为事态体T的确定当量,称p为o关于o1与o2的无差异概率。,3.1.3 事态体的基本性质,性质3. 3任一事态体无差异于一个简单事态体。设有事态体T (p1, o1;p2, o2 ;pn, on)则必存在一个简单事态体T(p, o*;1p, o0
8、) T 其中: o* maxo1, o2 , , on o0 mino1, o2 , , on 且:,这里,qj(j=1, 2, , n)为oj关于o*与o0的无差异概率。,3.1.3 事态体的基本性质,根据性质3. 3比较一般事态体之间的优劣关系,可以转化为比较简单事态体之间的优劣关系(将问题简化)得到事态体之间两两的优劣或无差异关系后,再根据公理3.2(传递性)即可得到所讨论事态体的排序。,3.2 效用函数的定义和构造,设有决策系统(,A,F),在离散情况下,结果值可以表示为决策矩阵:,3.2 效用函数的定义和构造,矩阵O的第i行表示第i个可行方案的n个可能结果值,即事态体Ti(p1, o
9、i1;p2, oi2 ;pn, oin)(i=1, 2, , m)决策就是要对这 m个事态体进行排序。由第一节中的性质3.3知,存在简单事态体T,使得Ti(pi, o*;1pi, o0 ) Ti问题又化为对这m个简单事态体Ti进行排序。,3.2 效用函数的定义和构造,Ti(pi, o*;1pi, o0 ) Ti注意到这m个简单事态体Ti具有相同的结果值o*、 o0 ,根据定义3.3,其优劣关系可以由比较pi的大小决定。根据性质3.3,qjj是结果值oij关于o*与o0的无差异概率。 其中:,问题:如何测定无差异概率?,o* ,o0 ,3.2 效用函数的定义和构造,3.2.1 效用和效用函数的概
10、念 效用的概念 定义3.5设决策问题的各可行方案有多种可能的结果值o,依据决策者的主观愿望和价值倾向,每个结果值对决策者均有不同的价值和作用。反映结果值o对决策者的价值和作用大小的量值称为效用。,3.2 效用函数的定义和构造,3.2.1 效用和效用函数的概念 效用函数的概念 定义3.6若在事态体集合上存在实值函数u,有: (1)对任意的T1、T2,T1T2 当且仅当u(T1) u(T2) (2)对任意的T1、T2,且01,有 uT1 (1)T2=u(T1)(1)u(T2)则称u(T)为定义在上的效用函数。,3.2.1 效用和效用函数的概念,估计效用函数的方法 (1)标准效用测定法(概率当量法,
11、VM法) 思路:对于给定的结果值,测定其效用值。设有决策系统(,A,F),其结果值集合为: O(o1, o2 , , on) 记: o* maxo1, o2 , , on o0 mino1, o2 , , on 对于每一个结果值oj都存在一个概率值pj,使得 oj(pj , o*;1pj , o0)pj就可以作为结果值oj的效用值。,3.2.1 效用和效用函数的概念,(1)标准效用测定法(概率当量法,VM法) 步骤 设 u(o*)=1,u(o0)= 0; 建立简单事态体(x, o*;1-x, o0 ),其中x称为可调概率; 通过反复提问,不断改变可调概率值x,让决策者权衡比较,直至当x= pj
12、时oj(pj , o*;1pj , o0) 测得结果值oj的效用u(oj)= pj = pj u(o*)(1pj )u(o0),3.2.1 效用和效用函数的概念,估计效用函数的方法 (2)确定当量法(修正的VM法) 思路:对于给定的效用值,测定其结果值。 步骤 设 u(o*)=1,u(o0)= 0; 对于给定的效用值pj,构造简单事态体(pj , o*;1pj , o0) 通过反复提问,不断改变结果值o ,让决策者权衡比较,直至当o= oj时oj(pj , o*;1pj , o0) 得效用值pj对应的结果值为oj,即u(oj)= pj 。,3.2.2 效用函数的构造,介绍一种实用的效用函数的构
13、造方法。 基本思路对于决策问题的结果值集合,先用确定当量法找出一个基准效用值,即效用值等于0.5的结果值,称为确定当量o。其余效用值不再测定,而是按比例用线性内插的方法,用同一个标准计算得到。,3.2.2 效用函数的构造,方法设决策问题结果值集合为:O(o1, o2 , , on) 取 o* maxo1, o2 , , on o0 mino1, o2 , , on 并令 u(o*)=1,u(o0)= 0; 构造简单事态体(0.5, o*; 0.5, o0),用确定当量法找到该事态体的确定当量o,使得: o(0.5, o*; 0.5, o0),3.2.2 效用函数的构造,方法 对结果值进行归一化
14、处理,记归一化的结果值为x(oj),则: x*=x(o*)=1, x0=x(o0)= 0, 0x(oj)1, 记确定当量o的归一化值为,也记为x0.5,得到经归一化变换后的效用曲线上的三个点:,(0, 0),( , 0.5),(1, 1),u,x,0,1,1,0.5,3.2.2 效用函数的构造,方法 在新区间0, 和, 1按同样方法插入点( x0.25, 0.25)和( x0.75, 0.75),保持比例关系,计算得:,效用曲线上新增两个点:,( 2, 0.25),(22, 0.75),u,x,0,1,1,0.5,0.25,2,0.75,22, 若认为点数太少,效用曲线不够精确,可继续按同样方
15、法在新产生的区间内插入效用中点,直到产生足够的点为止。若在效用区间0, 1 中插入2n个分点:,记相应的归一化的结果值为k ,有:,3.2.3 效用与风险的关系,在风险型或不确定型决策问题中,决策者选择方案几乎都要承担一定的风险,不同的决策者对风险的态度是有区别的。 效用表示了决策者对决策方案各结果值的偏好程度,也反映了不同类型的决策者对风险的不同态度。 因此从不同类型的效用函数可以看出决策者对风险的不同态度。,3.2.3 效用与风险的关系,中立型效用函数设有效用函数u=u(x),若对xlx2,有,则称该效用函数为中立型。,其效用曲线是一条直线。,中立型效用函数的效用值和结果值成正比例,因此可
16、以用结果值直接评选方案。,3.2.3 效用与风险的关系,保守型效用函数设有效用函数u=u(x),若对xlx2,有,则称该效用函数为保守型。,其效用曲线是一条上凸曲线,表示效用值随结果值的增加而增加,但增加的速度逐渐由快至慢。反映了决策者随结果值增加越来越谨慎,对风险持厌恶态度。,3.2.3 效用与风险的关系,冒进型效用函数设有效用函数u=u(x),若对xlx2,有,则称该效用函数为冒进型。,其效用曲线是一条下凸曲线,表示效用值随结果值的增加而增加,且增加的速度越来越快。反映了决策者随结果值增加越来越敢于冒险追求高额回报的态度。,3.2.3 效用与风险的关系,中立型效用函数,保守型效用函数,冒进
17、型效用函数,3.2.3 效用与风险的关系,混合型效用函数三种基本效用函数的混合,如:,混合型效用函数,表示当xx0时,即结果值不大时,决策者具有一定冒险精神;当xx0时,即结果值较大时,决策者对风险转而持谨慎态度。,x0,3.3 效用函数表,一、效用函数表的构造实际构造效用函数时,取n=6定出效用曲线上的26(64)个点,效用函数的精度已经足够。书后附表6给出了n=6对于不同的权衡指标值(0.5时,对应的是冒进(下凸)型效用函数,效用函数值无法直接查表。,3.3 效用函数表,一、效用函数表的构造 可以证明:0.5的效用曲线u(x)与=1的效用曲线u(x)是关于直线u=x对称的。因此, 0.5的
18、效用函数值可以按下面的方法求得: u(x)1 u(1x) 具体步骤见教材P62。 注:查表时在给定的列若没有对应的x值,则找出与之相邻的两个值x1、x2 ,查出对应的效用值后用线性内插的方法确定u(x)。,3.3 效用函数表,二、效用函数表的使用 例3.1 某企业欲投产一种新产品,有三种方案可供选择。已知市场存在三种状态:畅销、一般、滞销,三种方案在不同的市场状态下所获利润额构成以下的决策矩阵:,决策者认为: o4.5(0.5, 20; 0.5, 5),例3.1 试求该企业决策者的效用矩阵。,解: o* maxoij20, o0 minoij5u(o*)=1, u(o0)= 0 将决策矩阵的结
19、果值归一化:,得归一化后的决策矩阵为:,例3.1 试求该企业决策者的效用矩阵。,由 o4.5(0.5, 20; 0.5, 5) 得:,查P369附表6, 0.38 所在列,以x220.5为例 : 0.490621 x220.5 0.503698 而 u(0.490621)0.65625, u(0.503698)0.671875 用线性内插法:,解得u(x22) 0.6675。,例3.1 试求该企业决策者的效用矩阵。,同理得: u(x11) 0.7300, u(x12) 0.6091,u(x13) 0.4306, u(x31) 0.8742u(x32) 0.5596, u(x33) 0.2068
20、 且 u(x21)u(o*)=1, u(x23)u(o0)=0,得决策者的效用矩阵为:,例3.2 在上例中,若决策者认为: o11.25(0.5, 20; 0.5, 5) 试求该企业决策者的效用矩阵。,解: 同上例方法得归一化后的决策矩阵为:,例3.2,由 o11.25(0.5, 20; 0.5, 5) 得:,查P369附表6,1-0.65=0.35 所在列,以x320.44为例,u(x32)1u(1x32) 1 u(0.56) : 0.53689 0.56 0.5775 而 u(0.53689)0.734375, u(0.5775)0.75 用线性内插法解得u(0.56) 0.7433,因此
21、:u(x32)1 u(0.56) 0.2567,例3.2,同理得: u(x11) 0.3819, u(x12) 0.2598,u(x13) 0.1271, u(x22) 0.2920u(x31) 0.5725, u(x33) 0.0251 且 u(x21)u(o*)=1, u(x23)u(o0)=0,得决策者的效用矩阵为:,3.4 效用函数的曲线拟合,前面讨论了针对特定的结果值,如何测定其效用,我们得到的只是一些离散的效用值,要得到连续的效用函数,则需要用曲线拟合的方法。 常见的拟合曲线形式 线性函数型 u(x)c1a1(xc2)其中c1、a1、c2为待定参数。前面查表时用内插法确定某些效用值
22、,实际上就相当于效用函数为分段线性函数。,3.4 效用函数的曲线拟合,常见的拟合曲线形式 指数函数型,其中ci、ai(i1,2,3)均为待定参数。,双指数函数型,指数加线性函数型,3.4 效用函数的曲线拟合,常见的拟合曲线形式 幂函数型,其中c1、a1、c2 为待定参数。 不论采用哪种形式的函数,一般都尽可能化为线性函数通过最小二乘法确定待定参数。,对数函数型,3.4 效用函数的曲线拟合,3.4.1 幂函数型效用曲线的拟合 幂函数的一般形式yta (0a1)当0a1时,幂函数曲线是上凸的。在区间(0,)上,曲线的曲率是变化的,因此为了取得最佳的曲线拟合效果,一般取幂函数曲线的某一段(待定),作
23、为效用函数的近似曲线。 为此,作坐标平移变换:参见教材P66图3.6,3.4.1 幂函数型效用曲线的拟合,幂函数型的效用函数 坐标变换后得:Y-ca(Tc)a (0a1) 令:,且Tx,则:,其中b、c为待定常数,这就是幂函数型的效用函数表达式。当a取特定值时,可设法用线性回归的方法定出b,c。,3.4.1 幂函数型效用曲线的拟合,线性回归确定参数 以a=0.5为例,得到一个待定的线性函数 ZABu(x) 若已知若干组(xi, ui)可由最小二乘法定出A、B,进而得出拟合的效用函数(过程略)。,移项后两边平方,整理得,Z,A,B,3.4 效用函数的曲线拟合,3.4.2 对数函数型效用曲线的拟合
24、 对数函数的一般形式ylnt (0t+)对数函数曲线是上凸的。在区间(0, +)上,曲线的曲率是变化的,因此为了取得最佳的曲线拟合效果,一般取对数函数曲线的某一段(待定),作为效用函数的近似曲线。 为此,作坐标平移变换:参见教材P68图3.7,3.4.2 对数函数型效用曲线的拟合,对数函数型的效用函数 坐标变换后得:Y-lncln(Tc) 令:,且Tx,则:,其中a、b、c为待定常数,这就是对数函数型的效用函数表达式。其中c的值可由u(1)和u() 确定,然后用线性回归的方法定出a,b。,X,3.4.2 对数函数型效用曲线的拟合,参数的确定 由u( 1 )1和u()0.5 得:,即:,两式相除:,