1、东北师范大学硕士学位论文有缺失数据的双向有序方列联表的统计推断姓名:李佳宁申请学位级别:硕士专业:概率论与数理统计指导教师:高巍20050501摘 要列联表在实际问题中有着广泛的应用,是统计分析中一个重要的研究领域。同时在对列联表数据进行分析的过程中,经常会遇见有缺失数据的情况。应用工作者最关心的是如何用有效的统计方法分析缺失数据的实际问题,即用何种方法为缺失数据确定一个合理的替补值,补充到原缺失数据的位置上并尽可能接近缺失的原数据值。本文讨论的是有缺失数据的双向有序方列联表的统计推断如临床试验研究中,由于试验本身特有的性质或试验个体不按规定完成试验因而导致部分缺失数据的发生。当数据是有信息的
2、缺失而且变量属于有序情形时,如何充分利用这些信息进行统计推断也是一个很有意义且富有挑战性的问题文中提出的方法可以用于解决上述问题本文在充分考虑分类变量有芋性的前提下,建立有约束的对数线性模烈一 碍 其中,和 一 满足七 七一 巧, , ,州, 然后给出基于模型的算法从对具体实例数据的处理上可以看到研究的问题得到了较为完满的解决关键词:缺失数据;双向有序方列联表;对数线性模型 , , , , , : 一,垮,岫 一 嘲 ;博 , 触 , , : ; ;独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人
3、已经发表或撰写过的研究成果,也不包含为获得东北师范大学或其他教育机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说髓并表示谢意学位论文作者签名: 丝 日 期。坦主: 兰学位论文版权使用授权书本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和磁盘,允许论文被查阅和借阅本人授权燃童固篮!硝东北师范大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其它复制手段保存、汇编学位论文(保密的学位论文在解密后适用本授权书)学位论文作者签名; 指导教师签名:
4、日 期 丝 : 。至 日 期学位论文作者毕业后去向:工作单位通讯地址:挝缝亟燮邮编: !呈引 言列联表是由两个或两个以上变量进行交叉分类的频数分布表,在临床试验、社会调查、生命科学以及可靠性研究等方面有着广泛的应用由于列联表有较强应用背景,在过去的一个世纪里,列联表研究取得了丰硕的成果如提出了对数线性模型、模型、模型等,在这些模型的假设下,参数估计、方差分析等问题为我们所熟知在临床药物试验中研究药物的有效性时,为了克服混杂因子以便得到可靠的分析结果,往往采用分层抽样,把患者按某一特征进行分层,来研究药物的有效性。为了解决这类问题研究高维列联表变量之间的关系显得尤为重要,优比是用来度量各变量之间
5、关系的一种重要度量。 ()有关于这方面的讨论在过去的研究中,主要讨论药物有效性的齐次性,即药物在各个有序层是否呈现出同样的效果但当分层变量为有序变量(如年龄)时,基于生理因索的考虑,齐次性的假设考虑往往是不尽合理的,即药物有效性应随着各个有序层的次序变化,呈现出某种趋势更具合理性。在疾病诊断方面,同样会遇到有序列联表(其中一个变量是有序的)的统计推断问题如对某种疾病诊断分为一定患有该疾病;可能患有;可能或一定不患有,两病理专家独立地对患有该种的疾病某一群体做出诊断于是得到一个 维的列联表,这里可能有两个感兴趣的问题,()两病理专家的诊断是否诊断一致;()两病理专家的诊断结果是否呈现某种单调趋势
6、有序列联表的统计推断是具有普遍性,关于这方面的研究可以参考()的专著对有序约束条件下列联表的统计推断,目前国内外的研究仍在探索中,还很不完善,并且其研究主要集中在低维列联表方面 ()研究了维列连表在随机序下的统计推断()研究了 ()维列联表优比( )在简单半序下的统计问题()研究了一投影与对数线性模型中的参数在序约束条件下最大似然估计之间的关系, ()研究了似然序下的统计推断 ()讨论了二项分布的参数在各种模型下的统计推断 ()在最近出版的专著中,也对目前有序列联表方面的理论研究进行了总结在实际应用方面,这些方法大多太复杂无法在实际中实施,关于这方面的论述可以参考 ()的文章。在进行数据分析过程中,人们经常会遇到有缺失数据的情况应用工作者最关心的是如何用有效的统计方法分析缺失数据的实际问题,即用何种方法为缺失数据确定一个合理的替补值,补充到原缺失数据的位置上,并尽可能地接近原缺失数据。如在临床试验研究中,由于试验本身特有的性质或试验个体不按规定完成试验因而导致部分缺失数据的发生当数据是有信息的缺失而且变量属于有序情形时,如何充分利用这些信息进行统计推断也是一个富有挑战性的问题这时,需要研究数据的缺失机制模型,同时也耍考虑这时的数据是由重复观察而得到的。与通常独立抽样是不同的。该问题的研究可以用来处理纵向数据