数学建模专题汇总-离散模型.doc-资源下载-道客多多-道者的世界，分享的人生！

数学建模专题汇总-离散模型.doc

1、离散选择模型 1离散模型 1 离散回归模型一、离散变量如果我们用 0，1，2，3，4，说明企业每年的专利申请数，申请数是一个离散的变量,但是它是间隔尺度变量，该变量类型不在本章的讨论的被解释变量中。但离散变量 0 和 1 可以用来说明企业每年是否申请专利的事项，类似表示状态的变量才在本章的讨论中。在专利申请数的问题中，离散变量 0，1，2，3 和 4 等数字具有具体的经济含义，不能随意更改；而在是否申请专利的两个选择对象的选择问题中，数字 0 和 1 只是用于区别两种不同的选择，是表示一种状态。本专题讨论有序尺度变量和名义尺度变量的被解释变量。离散选择模型 2二、离散因变量在讨论家庭是否购房的

2、问题中，可将家庭购买住房的决策用数字 1 表示，而将家庭不购买住房的决策用数字 0 表示。1yesxno如果 x 作为说明某种具体经济问题的自变量，则应用以前介绍虚拟变量知识就足够了。如果现在考虑某个家庭在一定的条件下是否购买住房问题时，则表示状态的虚拟变量就不再是自变量，而是作为一个被说明对象的因变量出现在经济模型中。因此，需要对以前讨论虚拟变量的分析方法进行扩展，以便使其能够适应分析类似家庭是否购房的问题。因为在家庭是否购房问题中,虚拟因变量的具体取值仅是为了区别不同的状态，所以将通过虚拟因变量讨论备择对象选择的回归模型称为离散选择模型。离散选择模型 3三、线性概率模型现在约定备择对象的

3、0 和 1 两项选择模型中，下标 i 表示各不同的经济主体，取值 0 或 l 的因变量表示经济主体的具体选择结果，而影响经济主体进行选择的iy自变量。如果选择响应 YES 的概率为，则经济主体选择响应 NOix(1/)ipyix的概率为，1(/)iipx则。/)1/0(/)i iiiiEyy(/)ii根据经典线性回归，我们知道其总体回归方程是条件期望建立的，这使我们想象可以构造线性概率模型 (1/)(/)iiiipyxEyx0ikiiu描述两个响应水平的线性概率回归模型可推知，根据统计数据得到的回归结离散选择模型 4果并不一定能够保证回归模型的因变量拟合值界于0，1。如果通过回归模型

4、式得到的因变量拟合值完全偏离 0 或 l 两个数值，则描述两项选择的回归模型的实际用途就受到很大的限制。为避免出现回归模型的因变量预测值偏离 0 或 1 的情形，需要限制因变量的取值范围并对回归模型式进行必要的修正。由于要对其进行修正，那么其模型就会改变，模型改变会导致似然函数改变，这就是我们下面要讨论的。现在我们讨论的模型与判别分析的目的是一样的，但有区别。 2 二元离散选择模型一、效用函数为了使得二元选择问题的有进一步研究可能，首先建立一个效用函数。在讨论家庭是否购房的问题中，可将家庭购买住房的决策用数字 1 表示，而将家庭不购买住房的决策用数字 0 表示。用表示第个人选择买房的效用，

5、表示第1iUi 0iU个人选择不买房的效用。其效用均为随机变量，于是有i离散选择模型 5（1）1100()2i iUuiX将(1)-(2),得 10101012()()ii iiui记： *0iiiyU12*01iiiu则有，格林称该模型为潜回归。*i iYuiX离散选择模型 6这是二元选择模型的切入点。称为过渡变量（潜在的），这个变量是不可观*iY测的。当效用差大于零，则应该选“1” ，即购房；*iY当效用差小于零，则应该选“0” ，即不购房。i故 *(1)(0)()1iiipPuF i iXX iiiYi i 此处已经通过，将自变量与事件发生的概率联系起来了。为概率提供了一*

6、i个潜在的结构模型。现在的问题是服从何种分布？既然是分布函数，则必须满足分布函()F()F数的条件.离散选择模型 7二、两类常用的模型根据以上的分析，我们的问题已经转化为作为有什么形状，即密度函数()F具有什么样的函数形式。采用累积标准正态概率分布函数的模型称作 Probit 模f型，或概率单位模型，用正态分布的累积概率作为 Probit 模型的预测概率。另外logistic 函数也能满足这样的要求，采用 logistic 函数的模型称作 logit 模型，或对数单位模型。注：分布在此时是以 y 轴为对称。（一）Logit 模型因为 *(1)(0)()()iii ipYPuPuF i i

7、 iXX如果我们取 F（.）为逻辑函数（ LOGIT）,即（满足分布函数的条件），有1()xex离散选择模型 8*1(1)()ii ii i epYFe Xi XX为了更简化模型，我们令iiui，，*12iiiikxx *iiu则 iiiYux有 *FiXep()()1xii(1/)iipyxe()iipiiix离散选择模型 91exp()1/)exp()iiiiy /iiiiiiy ()()/)(iiiiii1/exp1expiiiiiipy（非线性）()()/iiiy（广义非线性） ln1()iiipx（2）iiiyu称（2）式为逻辑斯蒂回归模型。（二）PROBIT 模型离散选择模型

8、 10更为一般的情形，如果选择 F（.）是标准正态分布，则产生 PROBIT 回归模型。(1/)iiipyx 21()exp()ii tdx（3）ii称（3）式为 PROBIT 回归模型。注 Probit 曲线和 logit 曲线很相似。离散选择模型 11-4 -2 0 2 400.20.40.60.81标准正态概率分布曲线0 5 10 15 20 25 3000.20.40.60.81离散选择模型 12logistic 分布曲线使用哪个分布是一个很自然的问题，logit 曲线除了在尾部比正态分布厚得多以外，两条曲线都是在 pi = 0.5 处有拐点，logit 曲线更接近一个自由度为 7 的

9、 t 分布（格林书认为自由度是 4 的 t 分布）。所以，对于的中间值（比如-1.2 到 1.2 之x间）来说，两种分布会给出类似的概率，但是当非常小时，逻辑斯蒂回归模型比 PROBIT 回归模型倾向于给出（）较大的概率值，而在非常大0y*x时，倾向于给出（）较小的概率值。利用函数式可以得到的概率值见0y*表一。表一 Probit 模型和 logit 模型概率值yi正态分布函数逻辑概率分布离散选择模型 13pi = iytde21pi = iye1-3.0 0.0013 0.0474-2.0 0.0228 0.1192-1.5 0.0668 0.1824-1.0 0.158

10、7 0.2689-0.5 0.3085 0.37750.0 0.5000 0.50000.5 0.6915 0.62251.0 0.8413 0.73111.5 0.9332 0.81762.0 0.9772 0.88083.0 0.9987 0.9526离散选择模型 14特点尾薄尾厚 3 二元离散选择模型最大似然估计下面我们来构造二元离散选择模型的似然函数。这是二元离散选择模型最关键的问题。因为 *(1)(0)()iiiipYPuxiiiipY我们假设有以 Y 轴为对称的概率密度函数 f(.)，则*(1)(0)(0)iiiipuxiiPu()ii离散选择模型 151()()iiFx*(0

11、) ()1()iiiiiipYPuFxx 于是模型的似然函数为 1201(,)()()i iniiYYP11()()i iiiLFx两边同时取自然对数，则 1lnln()1)ln()iiiiiYYF xx对数似然函数最大化的条件是离散选择模型 16（4）0Xini iii FfYFfL1)1(l一、对数单位模型的似然函数将和代入()1eXX2()()1()1deXX（4），则似然方程为。1ln()0iiiiLy若包含常数项，则一阶条件意味着预测概率的平均值一定等于样本中“1”的比率。i对数单位模型对数似然函数的二阶导数为 1ln()()niiiiLX二、概率单位模型的似然函数离散选择

12、模型 17如果是正态分布，则对数似然函数为 10lnl()ln1()i ii iyyL xx1010()()i i i ii iiyyyy x概率单位模型的对数似然函数的二阶导数为：。1ln()niiiiLX例一在一次住房展销会上，与房地产商签订初步购房意向书的共有 325名顾客，在随后的 3 个月的时间内，只有一部分顾客确实购买了房屋。购买了房屋的顾客记为“1”，没有购买的人记为 “0”。以顾客的年家庭收入为自变量 X，根据表二资料，分析收入 9.5 万元的家庭买房的可能性。程序如下。data a;离散选择模型 18input x n r;cards;1.50 25.00 8.002.50

13、 32.00 13.003.50 58.00 26.004.50 52.00 22.005.50 43.00 20.006.50 39.00 22.007.50 28.00 16.008.50 21.00 21.009.50 15.00 10.00;proc logistic data=a;output out=ll p=phat ;model r/n=x /link=normit;离散选择模型 19proc print data=ll;run;表二例一的分组数据资料年家庭收入（万元）签订意向书人数（人）实际购房人数（人）1.5 25 82.5 32 133.5 58 264.5 52

14、225.5 43 206.5 39 227.5 28 16离散选择模型 208.5 21 219.5 15 10分别用 LOGIT 和 PROBIT 模型讨论这个问题。表三 LOGIT 模型名称参数估计值标准差Wald 统计量自由度显著性水平Exp(B)常数项 -1.1992 0.3024 15.7206 1 .0001X 0.2430 0.0560 18.8443 1 .0001 1.275ln1.920.43pX离散选择模型 21ln1.920.439.5103pex(.678)1ep(exp(1.093)/ .75121)iiipy表四 probit 模型名称参数估计值标准差Wald

15、统计量自由度显著性水平常数项 -0.7445 0.1848 16.2242 1 .0001X 0.0340 19.7145 1 .0001离散选择模型 220.1510(1/)ttpyx0.745.121exp()xtd0.745.1*92t0.692exp()0.7549td 4 多元离散选择模型多种选择的情形存在着几种决策，这是在三个或三个以上的备择中选择一个决策。有两种决策集，有序的和无序的。例如，对某个候选人的态度：赞成，反对和弃权中的选择是无序的。客户的信用等级 1，2，3，4，5 级中的选择是有序的。有序和无序的情形使用相当不同的技术。由于目前许多有序离散回归模型的应用，离散选择

16、模型 23故先讨论有序情形。一、有序 Logistic 模型及其估计排序多元离散选择模型问题普遍存在于经济生活中。其模型的构建为：设，是不可观测的，人们观测到的是*iiiYux*Y12/3yxJ离散选择模型 24（5）*12*3*11(,)23,)JYyJY如如如是门槛（threshole）值。(1,2)j *)iijiijPPuxijiuxjiF根据两水平的 Logit 模型的思路，有（6）(/)ln1jiPyjx离散选择模型 25将（6）变形，有 (/)(/)ji jii iPyjePyje x xx（） (/)1jijijex1,2jJ则 11()()iiePyPyx21(2)(2

17、)()i ii ieeyyy xx离散选择模型 263 2(3)(3)(2)11i ii ieePyyPy xx 1()()()1Ji Jii ieeyJyJyJ xx有 1()(1)ijnJ dijLPyjyj11 ijji jiji jidnJijee xx离散选择模型 2711lnln1ji jiji jinJijij eeLd xx其中 1，表示第个个体选择了第个水平；ij0，表示第个个体没有选择第个水平；ijij；。J解方程，得的极大似然估计。ln0L二. 有序 Probit 模型及其估计若假定服从正态分布，且有零均值，方差为 1，则u*11(1)ii ii iPYPu

18、 xx离散选择模型 28*121221(2)i i ii i iPYYPu xxx2323323i i ii i i*11 1()ikikkiikkiki 1ij JiiJiPYJYPuxx则其似然函数为： 1ijnJdiijLy11 ijnJ djijiij xx两边取自然对数，有离散选择模型 291lnlnnJijiijLdPyj11lnJijjijiij xx再对求导数并令其为零，解出方程组中的，得到模型参数的极大似然解。例二下表是某金融机构客户的个人资料，这些资料对一个金融机构来说，对于客户信用度的了解至关重要，因为利用这些资料，可以挖掘出许多的信息，建立客户的信用度评价体系。所选变量为：x1: 月收入x2：月生活费支出x3：虚拟变量，住房的所有权，自己的为“1” ，租用的 “0”离散选择模型 30x4：目前工作的年限x5：前一个工作的年限x6：目前住所的年限x7：前一个住所的年限x8: 家庭赡养的人口数type：信用程度， “5”的信用度最高， “1”的信用度最低。data a;input x1-x8 type;cards;300015000 2 8 6 2 5 3850425 1 3 3 25 25 1 3100030000 0.1 0.3 0.1 0.3 4 1900022501 8 4 5 3 2 5400010001 3 5 3 2 1 4

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？