1、基于大数据的反恐情报数据仓库体系结构设计 瞿志凯 张婷 中国人民武装警察部队学院 摘 要: 目的/意义大数据背景下,反恐情报工作的深层次变革正在酝酿和发生。分析数据的相关性、发掘数据的深层次价值,是大数据反恐情报研究的关键。方法/过程在对大数据反恐情报、传统数据仓库体系结构相关理论研究的基础上,将大数据、反恐情报、数据仓库进行深层次融合,结合当前我国反恐情报数据库的现实问题,构建了以反恐情报主题数据库、反恐情报数据仓库为核心的基于大数据的反恐情报数据仓库体系结构。结果/结论通过对基于大数据的反恐情报数据仓库体系结构的构建,以期为我国反恐情报的信息化分析和服务决策能力提升提供技术支撑。关键词:
2、大数据; 反恐情报; 数据仓库; 作者简介:瞿志凯(ORCID:0000-0002-7371-5870),男,1987 年生,硕士研究生,研究方向:公安情报学,反恐情报;作者简介:张婷(ORCID:0000-0002-0303-1465),女,1987 年生,硕士研究生,研究方向:军事情报学,反恐情报。收稿日期:2015-12-05Design of the Architecture of Data Warehouse for Counter- terrorism Intelligence Based on Big DataQu Zhikai Zhang Ting The Chinese Pe
3、oples Armed Police Force Academy; Abstract: Purpose/SignificanceThere is a fundamental change for the counter- terrorism intelligence work in the era of big data. Analyzing the correlation of data and excavating the deep value of data are the key activities in the big data- based counter- terrorism
4、intelligence research.Method/ProcessOn the basis of relevant theoretical studies of big data- based anti- terrorism intelligence and traditional data warehouse architecture,combining with the realistic problems currently existed in China,this article constructs a big data- based counter- terrorism i
5、ntelligence data warehouse architecture with counter- terrorism intelligence subject database and counter- terrorism intelligence database as its cores.Results/ConclusionThe study can provide technical support to Chinas counter- terrorism intelligence information analysis and service decision making
6、 ability improvement.Keyword: big data; counter-terrorism intelligence data; warehouse; Received: 2015-12-05随着信息技术的迅猛发展,数据获取和存储的枷锁已被大数据的洪流所冲破。海量数据充斥于社会生活的方方面面,数据的体量规模不断膨胀,数据类型多种多样。在这样的时代背景下,涉恐人员及恐怖组织的行为活动不可避免地会在海量数据信息中留下蛛丝马迹。仅仅依赖传统的思维和技术手段难以发掘出有价值的反恐情报。分析数据相关性,挖掘数据的深层次价值正是大数据的优势所在。大数据技术能够拓展反恐情报的收集和获
7、取渠道,提升反恐情报的综合分析处理能力,提高对涉恐人员及恐怖组织的轨迹追踪与行为预测的精确度,增强对恐怖主义活动的预警与监控的时效性及科学性等。因此,运用大数据来研究反恐情报既是大数据时代的主旋律,更是解决我国反恐斗争现实问题的迫切需要。目前对于大数据反恐情报的研究中,主要集中在以下三个方向,第一类对大数据在反恐情报工作中的作用及优化策略进行研究,如李本先等(2014)大数据在反恐情报工作中的应用研究1;第二类是对大数据在反恐情报特定环节的具体应用进行研究,如侯睿(2014)大数据时代的反恐情报收集与分析2;第三类是对大数据背景下反恐情报的现实问题和应对策略进行研究,如万向阳(2015)反恐行
8、动情报分析系统大数据障碍及其改进3。虽然在大数据反恐情报研究方面已经取得了部分学术成果,但是大数据反恐情报研究仍停留在理论探索阶段,对大数据技术在反恐情报中的应用仍然不够充分。因此,本文从技术应用的角度,将大数据反恐情报与数据仓库研究两者相结合,构建基于大数据的反恐情报数据仓库,以期为大数据反恐情报深层次数据挖掘提供技术支撑,同时丰富大数据在反恐情报中的理论和实践研究内容。1 大数据背景下的反恐情报与数据仓库目前对于大数据仍未有公认的定义。维克托迈尔- 舍恩伯格在大数据时代一书中将大数据定义为:不用随机分析法这样的捷径,而采取所有数据的方法4。维基百科则将大数据定义为:无法在可承受的时间范围内
9、用常规软件工具进行捕获,管理和处理的数据集合5。本文比较认可维基百科对于大数据的概念界定。概念界定的不确定性,使得大数据特征的界定同样存在着不同的归纳和阐述。其中比较有代表性的是大数据具有“4V”特征:规模性(Volume),即数据体量的海量;多样性(Variety),即数据类型的繁杂;高速性( Velocity ); 即数据增长及处理速度的超快速性6。价值性(Value),即数据价值的低密度7。本文将从大数据的定义和特征出发深入探究大数据背景下反恐情报和数据仓库的关系。1.1 大数据背景下的反恐情报反恐情报是指为预防和打击恐怖主义而收集和获得的关于恐怖分子、恐怖组织及其行为和事件等内容的情报
10、8。随着我国对恐怖主义活动的常态化高强度打击,涉恐人员及恐怖组织的行为活动愈加隐蔽,通过人力或秘密手段获取反恐情报的难度和风险越来越大。同时恐怖主义利用互联网等信息技术手段宣扬恐怖思想,策划、组织、实施恐怖活动已成为的新趋势。2015 年 7 月 1 日颁布实施的中华人民共和国国家安全法中明确规定:开展情报信息工作,应当充分运用现代科学技术手段,加强对情报信息的鉴别、筛选、综合和研判分析。大数据在反恐情报中的应用是现代化科学技术手段运用于在情报工作中重要表现。大数据时代,数据信息之间的互容性极大增强,表面无关的信息在其深层次上却有着千丝万缕的关联。因此,大数据背景下的反恐情报就具备了独有的特征
11、。1.1.1 极度的综合化大数据的数据体量是海量的,数据内容具有极强的综合性。就反恐情报源而言,反恐情报源更加开放、涵盖范围更加广泛,包括涉恐信息相关联的一切来源。一方面,反恐情报中涉及国家安全、政治安全、社会安全、公共安全等全方位的内容;另一方面,社会因素、经济因素、心理因素等多层次因素与反恐情报有了更深层次的结合,因此反恐情报存在于国家、社会、公共生活的方方面面。1.1.2 极度的碎片化大数据在强调数据的准确性的同时,允许数据信息一定程度的混乱与碎片化。反恐情报混杂于海量的无关信息之中,零散、模糊的反恐情报的破碎程度进一步极大加深。这也是大数据价值性特征的外在表现。相较于海量级的无关数据信
12、息,有价值的反恐情报数据规模小,离散度高,辨识度低。1.1.3 极度的弱关联性大数据的核心之一在于挖掘数据之间的相关性,如同谷歌运用大数据通过用户检索预测到流感疫情的爆发与扩散;沃尔玛将飓风与蛋挞销售通过大数据相关联,以提高蛋挞销量。原本毫无关联的数据信息,通过大数据构建起了相互关联,而这种关联往往微弱到难以察觉。在信息海洋之中,反恐情报隐秘于海量的社会、经济、公共信息等之中,不经过专业的整合与分析,数据信息的情报价值难以发掘。再加之恐怖分子及组织,为了逃避打击,努力将自己的意图、行为隐匿起来,极力避免相互之间的显性联系,更使得反恐情报的关联程度极度弱化。1.2 大数据背景下的数据仓库预测是大
13、数据的核心4,通过对已知的网络节点、网络结构和其他外部信息的分析,挖掘缺失的连接和预测未来可能出现的连接。这与情报主导反恐的目标相一致。而传统的操作型数据库在数据分析方面的局限性,使其难以满足大数据的现实需求。相比之下,数据仓库能够提供全视角、高集成的系统分析数据,并能够深入挖掘数据相关关系。因此,数据仓库在大数据反恐情报中具有十分重要的作用。William . H,Inmon 在“Building Data Warehouse ”一书中首次提出数据仓库的概念,将数据仓库定义为:数据仓库是面向主题的、集成的、非易失的、随时间变化的数据集合,用于支持管理决策9。数据仓库具有面向主题、集成、非易失
14、、随时间变化的特征。1.2.1 面向主题主题是指为某一决策问题而设定的,涵盖数据分析对象所涉及全部数据信息的完整的、一致的描述。大数据中描述事物的数据信息复杂而多元,面向主题的数据仓库使得海量数据更加系统,更具针对性。主题能够完整、统一地刻画各个分析对象所涉及的各项数据。按照不同主题实现反恐情报数据存储,使得反恐情报数据处理更加便捷和高效,更利于反恐情报数据分析,为反恐决策提供更高层次的决策支持。1.2.2 集成多样性的数据是大数据的特征之一,大数据中包含结构化数据、半结构化数据及非结构化数据,同时大数据允许数据的混乱,甚至包容错误数据。数据仓库将原本分散于各数据库的数据进行转化、去噪,形成全
15、面、统一、完整的数据。因此,数据仓库为大数据反恐情报的数据挖掘提供了实现途径和平台。碎片化的大数据反恐情报数据在数据仓库中呈现出整体特性,为大数据反恐情报数据的关联分析奠定了基础。1.2.3 非易失性传统的操作型数据库中的数据更新变化过于频繁。而大数据中数据的变化频度更加快速。没有相对稳定的数据就不能完成数据的预测和分析。数据仓库中数据一旦写入就不再变化,对决策者而言数据仓库中的数据是只读的。但是数据仓库中的数据又并非是一尘不变的。数据装载写入数据仓库的频度与数据库相比低的多,这使得数据仓库中保存了数据的历史状态,为数据的分析与预测提供了稳定的基础保障。1.2.4 随时间变化。数据预测的基础是
16、对历史数据的全面挖掘和分析,大数据预测与反恐情报预警都必须基于历史数据。数据仓库中的数据是批量装载的,装载的周期性使得数据仓库中的数据的时间广度更宽。同时数据仓库中的数据是一系列在特定时刻生成的复杂快照,使得数据仓库保存了活动和事件的历史记录。2 当前我国反恐情报数据库的特点2. 1 当前我国反恐情报数据库的优势反恐情报来源于对涉恐信息的加工整合。隐秘的、碎片化的反恐信息只有通过反恐情报数据库的归类、整理、存储才能更有效地发挥其反恐情报价值。当前我国反恐情报数据库普遍采用操作型数据库。其面向的是事务处理应用,能够快捷地完成对数据的检索、插入、修改和删除,数据的更新频度高。2.2 当前我国反恐情
17、报数据库的弊端小数据时代,操作型数据库的运用极大地提升了反恐情报的收集、整理的效率,一定程度地优化了反恐情报分析研判过程。但是,随着近几年来信息技术的快速发展,操作型反恐情报数据库在应对超大规模,非结构化数据时暴露出了自身难以克服的弊端。2.2.1 当前我国反恐情报数据库的分析能力薄弱面向事务处理的操作型数据库其核心在于对于数据的检索、插入、修改和删除。但是数据分析才是大数据反恐情报的核心。大数据及情报主导警务均强调对海量数据进行深层次综合分析,挖掘数据之间的相关性,服务于决策支持。虽然当前我国反恐情报数据库也具备一定的分析处理能力,但是当面对海量数据时其处理能力表现的较为缓慢、低效。2.2.
18、2 当前我国反恐情报数据库中“信息孤岛”现象突出(如图 1 所示)。在构建反恐情报数据库时缺乏统一的标准,数据开发工具、开发环境及数据库系统可能各不相同,不同的反恐情报数据库系统无法实现兼容共享,造成了“系统孤岛”现象。反恐情报部门间甚至是部门内部的数据信息难以实现流动共享,数据库中存在大量的冗余数据信息,造成了“数据孤岛”现象,在数据处理时必然造成处理效率低下的问题。基于自身部门需求单独构建的反恐情报数据库,无法实现反恐情报力量的有机整合,割裂了本应密切联系的反恐情报体系。同时当前我国反恐情报数据库中的数据集成度低,历史数据存储时间不同,难以支持对反恐情报的综合分析。图 1 反恐情报数据库“
19、信息孤岛”现象 下载原图2.2.3 当前我国反恐情报数据库中数据存储类型无法适应大数据的现实需求大数据中的数据包括结构化数据、半结构化数据、非结构化数据,而且半结构化和非结构化数据的体量比重巨大。视频数据、音频数据以及互联网中的流数据等非结构化数据难以被存储于反恐情报数据库之中。3 传统数据仓库体系结构传统数据仓库系统= ETL + 数据仓库存储+OLAP + 客户端10,如图 2 所示。传统数据库的体系结构主要包括 ETL、数据仓库存储、数据集市、联机分析处理(OLAP)、客户端五部分。图 2 传统数据仓库体系结构 下载原图3.1 ETL(Extract/Transformation/Loa
20、d)各个业务数据库中海量数据,通过 ETL 工具完成数据的抽取、转换、装载。将数据的格式、位数、编码等进行统一,消除重复冗余数据,进而装载于数据仓库中。包括:数据抽取( Data Extract)、数据转换( Data Transform ) 、数据清洗( Data Cleaning ) 、数据装载( Data Load) 。3.2 数据仓库存储(Data Repository)数据库仓库存储用于存储数据仓库数据和元数据。数据仓库中的数据按照主题进行分类存储。主要的存储方式包括:多维数据库、关系型数据库及两者相结合的方式。数据仓库中还存储有元数据。元数据是描述数据的数据,提供描述数据仓库的数据
21、信息及辅助用户使用和了解数据仓库的数据信息。3.3 数据集市(Data M arket)数据集市通过逻辑或物理方式从数据仓库中划分出来,面向某一特定部门,只存放某个主题所需的信息。数据仓库按照不同主题组织存储着全部门的数据信息,数据的处理量仍比较大,数据处理效率受到不同程度的限制。而数据集市只存放特定主题的数据,能够提高数据处理的效率,使得数据利用分析更加便捷。3. 4 联机分析处理( OLAP)OLAP 的核心是“维”,维是人们观察数据的特定角度。现实世界中事物往往多维度的,联机分析处理(OLAP) 为决策者提供多维度数据。OLAP 通过对数据进行多维分析,从多角度、多侧面剖析数据,使决策者
22、更加全面、系统的深入了解数据背后的关联及深层次意义。4 基于大数据的反恐情报数据仓库体系结构构建破除当前反恐情报数据库的技术瓶颈,从海量信息中深入分析数据的相关性,挖掘反恐情报的深层次价值,为反恐战略情报、战役情报、战术情报预警提供技术支持,是大数据反恐情报的迫切现实需求。同时,国家以立法的形式将情报信息工作纳入国家安全战略,突出了信息技术等科技应用在情报工作的重要意义。因此,本文在传统数据仓库的基础上创造性的提出基于大数据的反恐情报数据仓库,如图 3 所示。基于大数据的反恐情报数据库体系结构包括反恐情报源、反恐情报数据处理系统、反恐情报主题数据库、反恐情报数据仓库、反恐情报分析系统、反恐情报
23、元数据管理系统、反恐情报决策用户七部分。反恐情报数据从海量的反恐情报源中,经过反恐情报数据处理系统的抽取、转换、清洗,按照不同的主题装载入反恐情报主题数据库中。反恐情报主题数据库中按照不同的主题对反恐情报进行分类存放。反恐情报主题数据库与反恐情报数据分析系统直接相连,实现反恐情报战役、战术层面的挖掘分析。反恐情报主题数据库与反恐情报数据仓库连接再与反恐情报分析系统相连,实现反恐情报的综合分析,满足反恐情报高端用户(如国家级反恐机构)的反恐情报战略分析应用,并且实现部门级和基层级反恐情报机构的反恐情报战略、战役、战术的统筹谋划;同时考虑到数据仓库的建设成本和反恐情报数据库的实际,采取自下而上式的
24、构建方式,首先构建起反恐情报主题数据库,在此基础上构建反恐情报数据仓库。反恐情报分析系统与反恐情报决策用户相连接,实现用户需求的响应与反馈。反恐情报元数据管理系统贯穿于整个反恐情报数据仓库体系结构,为大数据反恐情报数据仓库提供全面稳固的技术保障支持。图 3 基于大数据的反恐情报数据仓库 下载原图4.1 反恐情报源如今,社会生活的各方面无时无刻不在产生着数据信息,这些海量数据的形态、结构复杂多样,存储于各类社会信息数据库之中。而涉恐人员及其组织作为社会中的一份子,亦无法摆脱海量数据而存在。恐怖分子及其组织在谋划、准备、实施恐怖活动过程中总是不可避免的留下数据痕迹。因此,大数据反恐情报源不仅要包括
25、反恐情报机构通过人力、技术等手段获取的反恐情报来源。更应当立足于大数据,广泛拓展反恐情报源,在传统反恐情报源基础上构建包含治安、刑事、医疗、交通、电信、物流、水电气、金融、互联网、地理信息等多维数据的大数据反恐情报源。4.2 反恐情报数据处理系统反恐情报数据处理系统主要是通过 ETL 工具对反恐情报源的数据进行抽取、转换、清洗、装载。将不同反恐情报源的中海量、离散、不清洁的数据进行转换、清洗、拆分、汇总等处理,实现反恐情报数据格式、编码、位数等的转换,冗余数据、无关数据及错误数据等的清洗,形成完整、统一的反恐情报数据。同时按照不同反恐情报主题将反恐情报数据装载入反恐情报主题数据库之中。4.3
26、反恐情报主题数据库反恐情报主题数据库面向反恐情报各职能机构,按照涉恐人员、恐怖组织、恐怖行为(事件) 三大主题进行划分。反恐情报主题数据库存放特定主题的数据信息,提供满足具体反恐职能机构所需的数据分析环境,减少数据处理量,提高数据处理效能,优化数据利用能力,能够快速解决某些特定具体问题,便于特定反恐职能机构的情报查询检索和综合分析。4.3.1 涉恐人员恐怖主义是为实现政治目的,通过对人身或财产非法使用暴力以恐吓、强迫政府和民众的行为11。恐怖主义通过或企图通过暴力、破坏、恐吓等手段,实现引发社会恐慌、影响国家决策、制造民族仇恨、颠覆政权、分裂国家的目的。恐怖主义究其根源是人类冲突,涉恐人员是实
27、现恐怖主义的物质载体,恐怖主义的一切主张和行为均不可能脱离涉恐人员而孤立存在。涉恐人员包括恐怖分子及恐怖主义相关人员。恐怖分子是恐怖主义的宣扬者和实践者,恐怖主义思想和主张通过恐怖分子的言行得以实现和扩散。恐怖分子包括实施宣扬、煽动、教唆恐怖主义的人员;组织、领导、参加恐怖组织的人员;组织、策划、实施恐怖行为的人员。恐怖主义相关人员是为恐怖主义提供信息、资金、物资设备或者技术、场所等支持、协助、便利的人员。恐怖主义相关人员虽未直接宣扬和实践恐怖主义,但是客观上为恐怖主义的实现和扩散提供了滋生蔓延的温床。大数据时代,数据信息成为人类社会活动的客观存在。涉恐人员无论采取什么样的措施都不可避免的会产
28、生数据信息。这些数据信息虽然是隐性的,破碎的,通过传统手段难以发掘,但是通过大数据的多维度的深入挖掘和深层次相关分析,隐藏在涉恐人员的言行背后的反恐情报一定能够发挥其预防和打击恐怖主义的价值。4.3.2 恐怖组织恐怖组织是由恐怖分子有机结合而产生的。恐怖分子因为共同的利益追求相互勾结联合,形成了目标统一,组织结构稳定,具有特定管理模式和稳固资金来源的有机整体。从我国恐怖活动的实际来看,除极少数“孤狼”式的恐怖袭击行为( 事件)外,绝大多数恐怖行为均源于相关恐怖组织。严密的组织、严格的纪律、稳固的资金支持等为恐怖主义行为活动提供了可靠的支持,恐怖分子个人意志由恐怖组织的集体意志得以最大化。因此,
29、恐怖组织的煽动性更强,活动规模更大。恐怖组织实施的恐怖行为(事件)的暴力性更强,破坏性更突出,造成的国际国内社会深层次影响更加严重。恐怖组织的人员、组织结构、管理模式、资金来源等从多个角度为收集和获取大数据反恐情报提供了有效途径和渠道。深入挖掘恐怖组织的大数据数据信息,发掘其相互关联,能够更加全面综合地了解和掌握恐怖行为的企图和动机,为寻找恐怖组织的内外部薄弱环节,预防恐怖行为(事件)和彻底瓦解恐怖主义提供可靠的情报支持。4.3.3 恐怖行为(事件)恐怖行为( 事件) 是指恐怖分子、恐怖组织基于特定的政治、宗教等目的,采取暴力、破坏、恐吓等手段实施的暴力犯罪行为。恐怖行为(事件) 是恐怖主义目
30、的动机的外在表现。一方面,持有不同恐怖主义主张和思想的个体和组织所发动的恐怖行为( 事件) 具有不同的特点,对恐怖行为(事件)的数据信息的深入挖掘,能够使反恐情报更具针对性,实现对恐怖主义的精确打击。另一方面通过对恐怖行为(事件)历史数据的综合分析,能够使反恐情报部门掌握恐怖分子、恐怖组织发展演变规律,实现反恐情报的战略决策应用。另一方面,恐怖行为( 事件)本身还具有感染示范作用,那些破坏性突出、社会影响力大的恐怖行为(事件),往往成为恐怖分子及组织效仿的对象,对于恐怖行为(事件) 的大数据分析,能够发挥反恐情报预警价值,真正实现预防恐怖主义。4. 4 反恐情报数据仓库4.4.1 反恐情报数据
31、仓库概念模型在反恐情报数据仓库概念模型的设计中首要的是确定反恐情报数据仓库的主要主题及相互关系。反恐情报主题数据库与反恐情报分析系统直接相连,实现的是反恐情报的战役、战术情报综合分析。而反恐情报数据仓库将反恐情报主题数据库的数据进行高层次综合,实现的是反恐情报的战略分析功能,从反恐情报涵盖内容及与反恐情报主题数据库对接的两方面考虑,将反恐情报数据仓库的主题设定为涉恐人员主题、恐怖组织主题、恐怖行为(事件)主题三大主题,如图 4 所示。涉恐人员主题、恐怖组织主题、恐怖行为( 事件)主题三大主题涵盖了反恐情报的全部范畴。在实际恐怖主义活动中,某一涉恐人员可以组织,参与,实施多起恐怖行为(事件);一
32、起恐怖行为(事件)中可以包含多名涉恐人员;某一涉恐人员可能涉及多个恐怖组织,而某一恐怖组织同样可能涉及多名涉恐人员;某一恐怖行为(事件)可能涉及多个恐怖组织,某一恐怖组织可能策划实施多起恐怖行为(事件),因此,涉恐人员、恐怖组织及恐怖行为(事件)均是多对多的关系。图 4 反恐情报数据仓库概念模型 下载原图4. 4. 2 反恐情报数据仓库逻辑模型a. 粒度。粒度是数据仓库中数据单元的详细程度和级别12。在数据仓库中粒度决定数据仓库中数据的详略程度,粒度值设置越小,数据量越大,综合级别越低;粒度值设置越大,数据量越小,综合级别越高。反恐情报粒度是反恐数据仓库中反恐数据单元的详细程度和级别。反恐情报
33、粒度是基于反恐情报需求而划定的。反恐情报实际工作中,职能层级越高对于情报需求的综合程度越高,能够更好地实现情报的战略分析,如国家级反恐情报机构。反之,职能层级越低对于情报需求的细化程度越高,能够更好地满足情报的战役分析、战术分析,如部门级和基层级反恐情报机构。因此,按照反恐情报部门的职能等级将反恐情报数据仓库的粒度划分为详细数据、轻度综合、高度综合三级,用于满足基层反恐情报机构、部门级反恐情报机构、国家级反恐情报机构的不同需求。b. 多维数据库。大数据时代,数据的维度已不仅仅局限于一维或二维,而是更广泛地以多维度数据形式显现。基于大数据的涉恐人员、恐怖组织、恐怖行为(事件)的多维特性更加突出。
34、而数据仓库作为决策支持的平台,以数据分析为目标,实现的是数据的多维度分析,以期全方位的展现数据背后的深层次关联与价值。因此,多维数据库就成为基于大数据反恐情报数据仓库体系结构中的核心部分。大数据视角下研究反恐情报,可以发现反恐情报中涉恐人员、恐怖组织、恐怖行为(事件) 均具有多维特性,而且在不同的属性中存在着相互的关联与共享。特定的时间点,某一涉恐人员可能在某恐怖组织的命令或影响下组织实施或者参与协助了某特定的恐怖行为(事件),因此,时间属性即是涉恐人员、恐怖组织、恐怖行为(事件)的共享属性。同理,个体信息也是涉恐人员、恐怖组织和恐怖行为(事件) 的共享属性;组织活动是恐怖组织和恐怖行为(事件) 的共享属性。目前,常见的数据仓库多维数据模型有星形模型、雪花形模型和事实星座模型三种。其中单个星形模型或雪花形模型对应的是一个主题,具有一个事实表和多个维表。而事实星座型模型中包含多个事实表,而且事实表之间可能共享一个或者多个维表。这一特性与反恐情报多维特性具有较高契合度,因此,本文在大数据反恐情报数据仓库构建中选择事实星座模型。