1、定量分析回归分析法,信息分析概述,信息分析是分析人员根据用户的特定信息需求,用各种分析方法和工具,对搜集到的零散原始信息进行识别、鉴定、筛选、浓缩等加工和分析研究,挖掘出其中蕴含的知识规律,并且通过系统的分析和研究得到有针对性、时效性。预测性、科学性、综合性及可用性的结论,以供用户决策使用。 简而言之,信息分析即通过针对性的信息搜集,深入的分析研究,挖掘隐藏于信息中的情报,从而为决策服务。,对信息分析概念的理解狭义/广义(两者区别在于有无信息搜集过程)广义上,是指在搜集、占有信息的基础上,对信息进行整理、排序、筛选、组织、存储、加工,从而发现新知识的过程;狭义上,是指对大量已知信息的深加工活动
2、,包括整理、排序、筛序、组织、存储、加工等环节。,对信息分析概念的理解要素构成从成因看,产生于相应的社会信息需求;从方法看,采用逻辑思维、统计学、情报学等学科方法;从过程看,需经过一系列相对程序化的环节;从成果看,形成新的增值的信息产品,即知识和情报;从目的看,最终是为不同层次的科学决策服务。,信息分析的作用(重点)基本功能整理功能(搜集整理信息,使无序变有序)评价功能(评定信息价值,以去粗取精、去伪存真、辨新权重)预测功能(分析已知信息内容,预测未知)反馈功能(根据实际效果,审议、修改和补充结论),其他作用鉴别和筛选作用(鉴别信息的真实性、可靠性和可用性;筛选出真实可用,有价值的信息)排列和
3、整序作用(整理杂乱无序的数据,进行分类、排列和索引)监视和预警作用(发现市场的机会和威胁,以采取必要措施)参谋和导航作用(为管理者提供决策的原材料和必要条件),信息分析的类型按分析方法定性分析根据社会现象或事物所具有的属性和矛盾变化,从事物的内在规定性来研究事物的一种方法或视角。具探索性、诊断性和预测性。(包括对比法、分析法、综合法、头脑风暴法 )定量分析为了对研究对象的总体得出统计结果而进行,强调对数据的分析。(包括时间序列法、回归分析法、聚类分析法、引文分析法),半定量分析既包含定性分析又包含定量分析的综合方法。定性把握问题的中心和方向,侧重宏观描述;定量提供数量依据,侧重于微观分析。(包
4、括德尔菲法、交叉影响分析法、内容分析法、层次分析法),回归分析法的概念回归分析法从各种事物之间的因果关系出发,通过对与研究对象有联系的事物与现象的 变化趋势进行分析,在此基础上预测研究对象未来数量状态的一种方法。回归分析法研究的相关变量关系中,自变量是非随机变量,因变量是随机变量;通过适当的方式,根据收集的相关数据绘制散点图,求出理想的回归直线或曲线,建立回归方程进行预测。,回归分析法的类型按模型中自变量的数划分一元回归模型:因果关系中只涉及因变量和自变量两个变量。多元回归模型:因果关系中存在一因多果。按模型中变量关系划分线性回归模型:自变量和因变量的关系基本呈直线型(线性变化关系)非线性回归
5、模型:自变量和因变量的关系呈非直线的变化。,按模型中有无虚拟变量划分普通回归模型:自变量都是数量变量虚拟变量回归模型:自变量既有数量变量又有虚拟变量。按自变量与时间关系划分与时间无关的相关关系:变量之间的相关关系与时间无关。相对时间的滞后性的相关关系:自变量和因变量之间的联动变化存在一个时间差。时间序列关系:自变量和因变量之间的相关关系服从一定的函数分布。,回归分析法的实施步骤1.根据定性认识,确定变量之间是否存在相关关系2.判断相关关系的大致类型3.绘制散点图4.进行回归分析并拟合出回归模型5.对回归模型的可信度进行检验6.运用模型进行预测,实例:电子资源用户满意度影响因子的多元线性回归分析
6、 用户对电子资源的满意程度包含了用户对资源内容、检索系统、资源利用效率和效果、数据库商的服务等诸多因素的感知。 通过对电子资源用户满意度问卷调查数据的多元线性回归分析,考查用户总体满意度与影响因子之间的相互依赖关系。通过检验回归方程的显著性,进行相关系数分析和多重共线性诊断,考查影响因子对用户总体满意程度的影响力大小,建立用户总体满意度与影响因子的回归方程式,获得策略矩阵。,(一)对用户满意度影响因子的初步选择通过进入“211工程”大学图书馆的专家群体的问卷调查获得的,共有15个涉及用户总体满意度的影响因子作为回归模型中的自变量。1全文数据量2原文获得比例3学科内容涵盖率4核心期刊比重5查全率
7、6查准率7时间跨度8更新频率,9检索功能10操作方便性11限定检索功能12浏览检索速度13阅读界面14结果显示方式15用户指南与帮助。,(二)多元线性回归数学模型的表示多元线性回归的数学模型来表示与之间存在的非确定线性关系:其中:为用户满意度(因变量),为影响用户满意度评价的因子(15个自变量),为回归系数,为随机误差。,(三)问卷下发和数据收集2007年4月,主要针对电子期刊和电子图书数据库,进行全校范围的用户满意程度调查,调查问卷含15个核心问题,发出问卷1 000份,收回840份,其中有效问卷800份。,(四)利用软件对影响因子进行多元线性回归分析 电子资源用户满意度回归方程的线性关系检
8、验1.回归方程的显著性检验,2.回归方程的复相关系数,回归方程的回归系数分析(1)标准化回归系数与方程,在多元线性回归中,除了整个回归方程的效果外,还需要判断各个自变量在拟合的回归中的作用大小。为了消除度量单位的影响,方法之一是将所有的变量都按它们各自的均值和标准差进行标准化,然后对标准化后的变量进行回归拟合。标准化回归系数反映了各指标对总体满意度的影响大小,可以得知影响力最大的是15用户指南与帮助,以后依次顺序是13阅读界面、1全文数据量、12浏览检索速度、14结果显示方式、9检索功能、4核心期刊比重、11限定检索功能、10操作方便性、6查准率、3学科内容涵盖率、8更新频率、5查全率、2原文
9、获得比例、7时间跨度。,回归方程的残差分析残差是预测值与实际值之差的信息,残差图也可用来判断回归模型的拟合效果。从残差分布的直方图与附于其上的正态分布曲线相比较中,可以认为回归方程残差服从正态分布,满足“残差分布为正态分布”的回归分析假设。,用户满意度问卷调查的观测量累计概率图,即标准化残差的正态-图,用于检验残差分布与正态分布差异的图形。该图的纵坐标为期望累计概率分布,横坐标为观测量累计概率分布,图中的斜线对应着一个均值为0的正态分布,图中的散点密切地散布在这条斜线附近,此斜线几乎被散点掩盖,也验证了随机变量残差服从正态分布,从而证明了样本来自于正态总体。,(五)分析结论,由影响因子的评价均值与标准化回归系数勾画出一个策略矩阵。,The end!,