1、第二章 医学数据、信息和知识,医学数据和计量症状学,医学数据,医学数据与信息,医疗数据的变异,医疗数据的解释,计量症状学,检查的诊断价值,症状的情报价值,症状预测价值的评估方法,教学要求,通过本课学习,学生应该能够:区分医学数据和信息描述医学数据的变异来源医学信息的类型及其量的计算,第一节 医学数据、信息和知识的定义与关系,数据(Data):为分析所预备的单个条目。一条数据( A datum):在这里是指对病人的一项观察。医学数据(medical data):有关一个病人的观察的集合。 信息(Information):带有某种解释或者附加含义的成 组的数据。从数据中抽出的有意义或者有用的事实。
2、简称之为解释过的数据(interpreted data)。 知识(Knowledge):一组用于从数据和信息中创造信息的规则、公式或者探索方法。,医疗过程中 数据、信息与知识,信息,知识,治疗,数据,小结:三者的区别在于加工与抽象的不同 数据 信息 知识 医疗过程的知识生产特点 知识增量是目的,叙述(narrative):由医生纪录。 测量数值(numerical measurements):血压、体温、化验值等。 编码数据(coded data): 文本数据(textual data):某些以文本形式报告的结果。 记录的信号(recorded signals):心电图、脑电图等等。 图像(
3、image) :X线等。,第二节 医学数据 医学数据的类型 (从表现形式划分),计量资料(measurement data):对每个观察对象的观察指标用定量的方法测定该指标的数值大小所得的资料。一般用度量衡单位表示,如身高、体重、浓度等等。计数资料(enumeration data):先将观察对象的观察指标按性质或者类别进行分组,然后计数各组该观察指标的数目所得的资料。如人群的血型分布。等级分组资料:具有计数资料的性质,同时又兼有半定量的性质。如化验结果的加号。上述的资料可以转化。,医学数据的类型(从分布角度划分),此外,还有一种类似的对变量(被观察单位的特征或指标)的分类方法: 分类变量(c
4、ategorical variable):定性变量,有两个或多个互不相容的类别或属性。又进一步分为无序分类和有序分类。无序分类包括二项分类和多项分类。 数值变量(numerical variable):定量变量,也就是计量资料。以连续形式存在的,如生理信号、ECG、EKG等。 有时可以数值化的数据与一段自由文本存放在一起。在计算机病历中往往存储这种混合式的数据(文字和数据)。固定和活动图像是另一类的混合数据,有时还附有自由文本式的文字评述。,医学数据的类型(变量分类),医学数据和变量的分布类型,每一条医疗数据至少应当包括4种元素:病人姓名(如韦小宝)问题的属性或参数(如年龄)参数的值(如40)
5、观察的时间(如1999年9月5日9:12),医学数据的组成,医学数据的变异变异的来源,变异(variation) 同值个体同指标之间的差异叫变异。,医学数据变异程度的测量,医疗数据通常不能提供完全的信息。也不能用肯定程度来确认病人。一条数据可能因为不精确和或不准确而偏离实际值。对其变异程度的测量可以有以下指标: 精密度:同一对象反复测量值的一致性。正确度:被测值与其“真值”的接近程度。精确度:一致性以及与其“真值”的接近程度。从测量误差的角度来说,精确度是测得值的随机误差和系统误差的综合反映。,第三节 医学信息,有关信息的定义至今多达百余种。从信息论的角度出发,目前大多数学者接受的定义是:“信
6、息具有物质属性,是物质的存在方式及运动的规律和特点的表征,是事物及其现象的内外特征、相互联系及作用的反映。”从不同角度可得出不同的定义。我们介绍几种具有代表性的观点。,R.V.L. Hartley. Transmission of Information. Bell System Technical Journal, 7(4):535-563, 1928.,1928信息传输:“信息” 是符号。发信者所发出的信息,就是从通信符号表中选择符号的具体方式。不管符号所代表的意义是什么,只要选择的符号数目一定,发信者发出的信息的数量也就确定了。信息是指有新内容、新知识的消息。,首次 从通信的角度,哈特莱
7、,香农,通信的数学理论信息论诞生的标志 信息是通信的内容,是“用来消除未来的某种不确定性的东西”,信息的多少反映了消除了的不确定性的大小,即信息是二次不定性之差。不定性就是对事物认识不清楚,不知道。信息就是消除人们认识上的不定性。 不确定性:对客观事物的不了解、不肯定。通信的直接目的就是要消除接受端(信宿)对于发出端(信源)可能会发出哪些消息的不确定性。,1916-2001,A Mathematical Theory of Communication in the Bell System Technical Journal (1948).,维纳,Norbert Wiener (1894-196
8、4),人有人的用处控制论与社会1950 维纳(N.Wiener)将人与外部环境交换信息的过程看成是一种广义的通信过程,认为信息是人们在适应客观世界的过程中与客观世界进行交换的内容的名称,是人与外部世界的中介。如果没有信息作为中介,人就会同外部世界隔绝,就不能认识世界和改造世界。 信息既不是物质又不是能量,信息就是信息。,钟义信,信息是事物存在方式或运动状态,以及这种方式/状态的直接的或间接的表述。从本质上讲,信息是事物自身显示其存在方式和运动状态的属性,是客观存在的事物现象。信息与认知主体有着密切的联系,信息必须通过主体的主观认知才能被反映和揭示。,信息的性质(个): 信息的内涵及特性很多,一
9、般可以从以下九个方面描述其信息的性质与内涵。,(1) 信息的相对性:一方面对于同一事物,不同的观察者获得的信息量是不同的。另一方面,不同的用户对信息的认识和需求也是不同的。因此,对信息系统的开发既要考虑共性的应用,也要考虑个性化需求。 (2) 信息的事实性: 事实性是信息最基本的属性。如果在信息系统中收集的信息不符合事实,则信息毫无价值。 (3) 信息的转移性:信息在时间上或空间上可以从一点转移到另一点。时间上的转移称之为储存,而空间上的转移称之为通信。,(4) 信息的变换性:信息是可以变换的,它可以由不同的载体和不同的方法来载荷。信息的变换性可以根据不同用户的不同需求,采用不同的信息表现方式
10、和方法来加工处理。例如,可以采用数据二维表的结构方式表达,也可以采用直方图等直观方式来表达。 (5) 信息的有序性:信息的有序性,一方面信息可以用来消除系统的不稳定性,增加系统的有序性;另一方面信息本身也可根据一定的规则进行编码。编码质量的好坏,直接影响系统的稳定性和整体 质量。 (6) 信息的动态性:信息是随事物变化而改变的客观反映。这种变化大多数表现为信息本身内容的变化,对于信息系统来讲,就是增加记录、修改记录或者删除记录。进而要求整个信息系统也要做相应的调整和对信息进行加工处理。,(7) 信息的时效性:信息是有寿命的。脱离了事物源的信息,因为不再能够反映变化了的事物的新的状态和本质,它的
11、效用就会逐渐减低,直至信息效用完全丧失。在开发信息系统时,要充分注意信息系统的响应速度,以保证处理信息的同步,确保信息的真实有效性。例如,天气预报信息就必须保证提前获知,才会产生社会的和经济的价值。 (8) 信息的共享性:信息可以被无限制的复制、传播或分配给众多用户,为大家而共享。基于这一特点,就要求信息的录入、加工、传输、存储、复制等所有的处理环节确保信息的准确性,又要求信息系统处理的高效率。这样真实有效的信息才能够为更多的用户共享。 (9) 信息的可转化性:信息在一定的条件下,可以转化为物质、能量、时间或其他,其中最主要的条件是被人们合理而有效的利用,达到知而获智。信息的利用才能产生知识的
12、积累,才能转化成为知识经济。,为了更好地掌握信息的内涵,我们需要引进一个概念全信息:即同时考虑到事物存在方式和运动状态的外在形式、内在含义和效用价值的认识论层次上的信息。仅考虑形式因素的信息语法信息仅考虑内容因素的信息语义信息仅考虑效用因素的信息语用信息,包括两种基本的类型:病人信息(patient-specific):信息来自于病人治疗。如数值、文本、图像。知识信息(knowledge-based):有关于医疗保健的科学文献。即以研究和实践为基础的科学知识纪录。,一、医学信息的类型,2018/9/2,22,二、信息量的计算,根据香农的定义,一条消息的信息含量的计算公式I=log(I/p)=-
13、logP 0PII是一条消息的信息含量, 以比特(bit)方式表示P表示的是一条信息发生的概率,三个概念,比特(bit):英语Binary digit(二进制数)位的缩写,是 数学家John Wilder Tukey提议的术语。这个术语第一次被正式使用,是在香农著名的信息论,即通信的数学理论(A Mathematical Theory of Communication)论文之第1页中。 比特串:比特串就是信息按照ANSI(美国国家标准编码)编码后转化为二进制存储。比如说10000101011110 这个就叫比特串,浮点:浮点型简单讲就是实数的意思 。浮点数在计算机中用以近似表示任意某个实数。具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是2)的整数次幂得到,这种表示方法类似于基数为10的科学记数法。浮点计算是指浮点数参与的运算,这种运算通常伴随着因为无法精确表示而进行的近似或舍入。,第四节 医学知识,一、医疗活动中的决策二、医学知识的类型,Who is she? How information from is she?,