1、国内外超级计算中心发展模式的研究和建议冯桂安 上海投资咨询公司林新华 上海交通大学概要:通过对美国、日本、欧盟超级计算中心发展模式的总结,梳理了我国超级计算中心建设情况和运营模式,在总结我国超级计算中心所取得的成效同时,针对其在成果应用、人才集聚以及经济促进等方面存在的发展瓶颈原因进行分析,对我国超算中心建设发展在管理机制和政策保障等方面提出建议,为我国超算中心建设和发展提供借鉴。关键词:高性能计算 超算中心 发展模式高性能计算在科学研究和产业领域具有广泛的应用和重要地位。高性能计算机(又称“超级计算机”)是为解决挑战性问题提供超强计算能力,性能最高、容量最大、功能最强的计算机系统。发展高性能
2、计算不但可以带动计算技术本身向更高水平迈进,更重要的是可以促进经济发展、科技创新、国家安全等方面一系列问题的解决。高性能计算发展水平是衡量一个国家科技实力的重要标志,是国家科技创新体系的重要组成部分。超级计算中心已成为世界各国(特别是发达国家)竞相争夺的战略制高点。一、国内外主要超级计算中心基本情况美国美国是高性能计算领域的霸主,其超算中心布局基本上可分为三大体系:美国能源部(DOE)下属六大国家实验室;美国国家科学基金会(NSF)支持的依托于高校的超算中心;围绕航空航天领域的超算中心,如美国国家航空航天局(NASA)下属Ames研究中心等。1美国能源部(DOE)美国能源部共有28个下属实验室
3、,其中11个为国家实验室,拥有世界级超级计算机的主要有6个。其超级计算机体系结构的构思、设计、建造以及运维等方面在世界上无出其右。表1 美国能源部体系序号依托机构数量超级计算机( 排名)研究领域1劳伦斯利弗莫尔国家实验室Lawrence Livermore National Laboratory5Sequoia(2)Zin(29)Dawn(52)Cab(63)Vulcan(65)核武器、核安全、天文、能源、人类基因组、气候变化2阿贡国家实验室Argonne National Laboratory2Mira(4)Intrepid(47)气候研究、发动机、宇宙、电池3橡树岭国家实验室Oak Rid
4、ge National Laboratory4Titan(1)Jaguar(6)Gaea C2(40)GaeaC1(85)新能源、气候变化、蛋白质、超新星,核聚变,光合作用4洛斯阿拉莫斯国家实验室Los Alamos NationalLaboratory3Cielo(18)Roadrunner(22)Luna(64)武器研发、物理、核安全5劳伦斯伯克利国家实验室Lawrence Berkeley National Lab1Hopper(19)能源、健康、环境6桑迪亚国家实验室Sandia National Laboratories5Red Sky(49)Pecos(70)Chama(71)Da
5、rk Bridge(92)Dark Sand(93)核武器、核安全、新材料、国家安全2美国国家科学基金会(NSF)美国国家科学基金会(NSF)正在推行一项5年12亿美元名叫XSEDE1项目,通过与美国16家高校及研究机构的合作,为世界各地的科学家提供免费的、最高性能的超级计算资源。表2 美国国家科学基金会体系序号依托单位数量超级计算机(排名)备注1国家超算中心National Center for Supercomputer Applications/伊利诺伊大学1Bluewater未参与TOP500排名;XSEDE项目领导者2圣地亚哥超算中心San Diego Supercomputer C
6、enter/加州大学圣地亚哥分校1Gordon(88)大量使用SSD3德州先进计算中心Texas Advanced Computing Center/德州大学奥斯丁分校3Stampede(7)Ranger(50)Lonestar 4(96)Stampede大量使用了Intel MIC4计算科学国家研究所National Institute for Computational Sciences/田纳西大学1Kraken XT5(25)2012年 Green 500 第一名3、航空航天以美国国家航空航天局(NASA)为代表等的国家机构、企业和大学等研发机构也都在开展为数不少的超级计算项目,代表有N
7、ASA Ames研究中心和美国空军研究实验室。表3 美国航空航天体系1美国国家航空航天局NASA Ames Research Center2Pleiades(14)Discover(53)天文、航天、天体物理学、气候变化2美国空军研究实验室Air Force Research Laboratory1Raptor(34)军事日本日本是高性能计算强国。从上世纪80年代中期开始,日本研发的超级计算机在性能方面就屡次超越美国。日本在超级计算机研发和使用方面,有两股学术势力在竞争,一是以本土化研发主机为载体,另一是采用国际通用型CPU组建主机。两股力量彼此竞争,促使日本成为继美国之后在超级计算机研制方面
8、水平最高的国家。日本没有大型的公共高性能计算平台,超算中心主要依托于专业研究机构和高校。目前,日本的文部科学省(MEXT)正准备启动一项面向2020年部署的E级超级计算机的计划2。表4 日本超级计算机分布情况序号依托单位自研主机通用性主机1日本理化学研究所RIKEN Advanced Institute for Computational Science (AICS)K Computer(3)2国际聚变能研究中心(IFERC)International Fusion Energy Research Centre Helios(15)3东京工业大学GSIC,Tokyo Institute of
9、TechnologyTSUBAME 2.0(17)4东京大学Information Technology Center, The University of TokyoOakleaf-FX(21)5高能加速研究机构High Energy Accelerator Research Organization /KEKSAKURA(41)HIMAWARI(42)6九州大学Research Institute for Information Technology, Kyushu UniversityFUJITSU(45)7筑波大学Center for Computational Sciences, U
10、niversity of TsukubaHA-PACS(51)欧盟欧盟在高性能计算软件和应用上都很有特色。PRACE 3、DEISA4等高性能计算研究计划是面向领导层的高性能计算战略,为欧盟高性能计算行业发展奠定了坚实的基础。欧盟承诺投入40亿欧元推进的PRACE项目,致力于提供世界级的计算资源和数据管理服务,并为提高计算系统能效和减少环境影响作出努力。表5 欧盟主要超算中心分布情况序号依托单位数量超级计算机(排名)备注1德国莱布尼兹超算中心(LRZ)Leibniz Rechenzentrum1SuperMUC(6)PRACE成员DEISA成员2德国尤里希研究中心(FZJ)Forschungs
11、zentrumJuelich 2JuQUEEN(5)JUROPA(89)DEISA成员3德国斯图加特大学HWW/Universitaet Stuttgart1HERMIT(27)DEISA成员4CEA/TGCC-GENCI, 法国2Curie thin nodes(11)IBM(29)PRACE成员5法国原子能委员会(CEA)Commissariat a lEnergieAtomique 1Tera-100(17)6英国Daresbury国家实验室Science and Technology Facilities Council - Daresbury Laboratory1Blue Joul
12、e(16)7英国爱丁堡大学University of Edinburgh2DiRAC(23)HECToR(35)8CINECA, 意大利1Fermi(9)PRACE成员DEISA成员9巴塞罗那超算中心Barcelona Supercomputing Center1MareNostrum(36)PRACE成员DEISA成员中国我国关于高性能计算发展战略主要由国家科技部主导,纳入国家高技术研究发展计划(863计划),以5年为周期,通过部省(市)合作计划开展主机研制工作5。目前我国公开拥有P级以上计算能力的超算中心有5家单位,分别是国家超级计算天津中心、国家超级计算深圳中心、国家超级计算济南中心和国
13、家超级计算长沙中心和中国科学院过程所。作为第一轮863高性能计算机研制计划的布局,中国科学院超算中心(北京)和上海超算中心分别拥有150T和200T的高性能计算机。目前国防科大正与广州市联合开展第三轮863计划下高性能计算机的研制工作,预计首期新超级计算机的计算能力可达40P。表6 国内主要超算中心情况序号单位主机规模配用电量主要应用领域备注1国家超级计算天津中心4.7PF(8),天河6MW,主机4.3MW石油勘探、高端装备研制、生物医药、新能源、新材料、气象预报、动漫设计等科学研究和工程计算面世时“天河1A”排名全球第一2国家超级计算深圳中心(深圳云计算中心)1.2PF(12) ,曙光配电2
14、6MW,主机3.6MW高性能计算:天文,海洋,核电、工程等香港、澳门、广东用户;云计算:鹏云系统,市民,政府,中小企业电信运行商合作、100G带宽;4.3万平米总建筑3国家超级计算济南中心1PF(28),神威蓝光100TF,浪潮神威蓝光1MW,其它1MW海洋环流、天气预报,生物医药、农业生态、金融计算等神威蓝光全自主,水冷,低功耗4国家超级计算长沙中心1PF(30),天河主机2MW, 公共服务中心,云计算中心,灾备中心;1/4的资源用于舆情监测湖南省、国防科大、湖大共建 5上海超算中心200TF,曙光主机1.3MW公共服务平台在国内开展服务时间最长、范围最广6中科院网络中心超算(北京)150T
15、F,联想主机0.8MW面向中科院体系,服务科学研究各领域中科院内部研究所计算资源体系建设二、国内外超级计算中心发展特点超算中心将有助于吸引更多的优秀科学家、工程师、研究人员集聚到超算中心开展工作,随之带来的好处包括通过研发更有竞争力的产品以及服务从而促进经济的发展,同时,加强本国的安全和国防力量6。虽然世界各国对超算中心所带来的成效都有普遍的认同,但由于发展条件的差异,国际超算中心与我国超算中心在建立和发展上呈现出不同的特点。 国际超算中心发展特点 目前国际上典型的超算中心发展模式有两种:股份制和政府直属,由相应的国家研究机构自主管理。虽然运营管理模式不同,但建设和运营资金基本来源于政府。美国
16、和欧盟的超级计算中心分别为这两种模式的代表。表7 美国超级计算中心运营模式建设资金来源 运营资金来源 隶属关系 运营管理模式 典型计算中心 联邦政府 州政府 联邦政府 州政府 依托单位 隶属于国家重点实验室 依托于大学的研究机构 中心自主管理 劳伦斯利弗莫尔(LLNL) 伊利诺斯(NCSA) 表8 欧洲超级计算中心运营模式建设资金来源 运营资金来源 运营管理模式 典型计算中心 欧盟 中央政府 地方州政府 欧盟项目 中央政府部委 地方州政府 依托单位 企业 股份制 董事会负责决策 执行委员会负责运营管理 芬兰(CSC) 巴塞罗那(BSC) 斯图加特(HWW) 通过总结国际先进的超算中心建设和运营
17、管理经验,可以看到,国际超级计算中心发展呈现以下特点可供我们借鉴:1、发展高性能计算技术是国家战略,但应用高性能计算由超算中心依托单位所决定。从美、日、欧的经验来看,几乎没有仅提供公共服务性质的高性能计算创新平台,超级计算中心往往依托于重要的国家研究实验室或是专业的研究所。2、科学研究人员是支撑高性能计算中心的主体,设施运维人员规模不断缩小。由于国际高性能计算中心依托国家实验室或研究所,在超算中心人员的结构上多以研究人员为主。超算中心人员结构上,对硬件的维护比例较小,而在逐步增加依托高性能计算的专业领域研究人员。3、国际超算中心承担的应用目标决定其硬件资源的配置规模。由于计算机部件升级换代的频
18、率较高,为解决高性能计算资源的需求与应用水平的差异,国际上的高性能计算中心往往采用2-3年短周期内就对现有计算资源进行逐步更新。我国超算中心发展的成效和瓶颈通过国家科技部“863”支撑计划中关于超级计算机研制规划,依托主机研制厂商和开展部省(市)合作协议,我国在超级计算中心建设方面已建立了相对固定的模式,可以分为三个角度:政治意愿、资金保障、技术支撑。政治意愿:我国通过部省(市)合作协议确立超级计算中心的建设计划。国家科技部代表国家科技战略对主机性能设定目标,实现国际科技竞争的目标。地方政府希望超算中心能成为区域科技发展的功能载体,为其集聚人才、创新科技并为经济发展产生推动力。资金保障:国家科
19、技部通过“863”专项资金配套主机研发厂商进行主机研发投入,地方政府除参与主机研制之外,承担超算中心后续运营维护资金保障。技术支撑:国防科大、曙光集团、江南计算所以及浪潮集团等,已不同程度得掌握了国际领先的超级计算机的研发和集成技术,保证了我国在国际超级计算机性能竞赛中持续领先。通过多年的滚动发展,超算中心已成为我国科技创新的重要功能载体,有力带动了一批重大科研项目和工程项目的推进,成为我国面向国际开展科技和信息技术领域重要的基础设施及交流平台。1、超算中心成为我国科技创新和产业振兴重要的基础设施和合作交流平台。长期以来,主要发达国家对我国高性能计算行业进行种种技术交流限制。超算中心的成立,并
20、创立了高性能计算公共性服务平台,将高性能计算从原来极为隐蔽的领域逐步向公众开放,有力支撑了一大批重大科技项目的研究和工业项目的研究,为我国开展科技创新和产业提升提供了重大的推进力。2、我国通过超算中心开展公共的计算资源服务模式,带动了我国高性能计算用户应用水平的逐步提升。以上海超算中心为例,通过10年的管理和运营,平台已有原来30余个用户发展到300多个,促进了高性能计算在各个领域应用需求的提升。3、超算中心在我国的普及发展积累培养了一支专业化的高性能计算研发团队。超级计算机由于其计算资源的领先性,往往在架构设计、核心部件、配套设施等方面拥有专业的需求。目前国防科大、曙光集团、江南计算所、浪潮
21、集团等多家单位已具备了研制世界领先的超级计算机的研发实力和集成能力。4、我国超算中心长期以来坚持公共性服务平台的属性,在客观上减少了科研机构、研究院所和企业自主建设计算中心所造成的资源重复投入,发挥了公共服务平台集约化的建设效果。与此同时,也应当看到目前我国超算中心在建立方面已形成模式,但在可持续发展方面仍面临诸多挑战:1、高性能计算应用缺少国家研究战略的导向性,国家级的计算资源规划与地方级的政府自我管理存在脱节。天津、深圳、济南、长沙等新兴的国家超算中心均以上海超算中心的运营模式作为蓝本,以地方政府投资建设加财政补贴运营的模式进行建设运营,但应用规模与地方科研需求并不完全相符。我国的基础科研
22、投入和水平决定了对超算中心的投入必须是一项长期过程,由于工业企业生产技术水平和工业化设计水平达到一定程度后,才会产生对高性能计算资源的大量需求,而我国工业化水平难以在近期带动高性能计算的大规模需求。2、围绕超级计算机为核心的独立核算体系造成计算资源与应用研究相互脱节。科研人员长期以来以外部人员的身份参与超算中心的运作,导致和主机服务人员合作黏性不足,难以带动高性能计算人才集聚和团队的培养。公共性的服务平台固然存在资源集聚共享的优势,但较难提供优秀的高性能计算人才的成长环境。缺乏应用的导向所配置的超算中心,无法承担起培养具有核心竞争力的高性能计算人才的重任。3、超算中心对维护计算资源可用性的重视
23、度高于计算资源的实用性,计算资源的使用与回报考量不足。为了鼓励用户依托公共服务平台创新,现有超算中心在服务一方面做优服务,另一方面采用远低于市场价格进行服务,以实现超级计算机使用率的提升,但对实际重大问题的研究推进成效重视度不足。推进我国超算中心发展的建议从国际超级计算中心发展趋势来看,超级计算资源作为一种稀缺性资源,是重要的国家战略资源,体现的是国家对基础科学和新兴产业的自主创新支持,需要得到政府财政性资金的长期支持。为进一步促进我国超算中心的可持续发展,建议从国家战略和地方政府的角度,进一步完善超算中心发展的基础环境:1、 要对超算中心所承担的高性能计算服务与地方政府的任务进行有序引导,让
24、优质的计算资源向重大科学挑战问题、向重大工程问题的求解进行集聚,实现高性能计算设计与使用的协调发展。2、 培养高性能计算领域的领军人物,加强超算中心与高校联手,实现超算中心与本地高性能计算人才的培养和输送,促进高性能计算人才在超算中心的集聚。3、在布局承担国家或地方重大科学研究方向的同时,需要继续维持一定规模的公共计算资源服务功能,加强对超级计算中心研究任务的筛选,提高高性能计算的实用度。同时,建议从以下方面加强政策的组织和协调。1、国家战略方面(1)相较开展超级计算机的性能竞争之外,开展全国性的高性能计算应用规划布局的需求更为紧迫。应从国家战略层面,对高性能计算服务于地方的任务进行有序引导,
25、让优质资源向重大科学挑战问题、向重大工程问题进行集聚。(2)对高性能计算发展国家战略开展多部门协同,从科技研发、产业布局、应用示范等方面,促进高性能计算的普及发展,维持一定规模的公共计算资源服务功能,降低超级计算机的使用门槛,普及高性能计算知识,推进高性能计算的深入应用。(3)应建立国家层面与地方政府联合对高性能计算长期投入的机制,统筹建设资金和运营资金,继续并从科研经费管理体制的角度入手,进一步提高地方在高性能计算领域的财政性资金利用效率。2、地方政府支持方面建议地方政府在开展超级计算中心建设的同时,进一步加强对超算中心后期运行发展的相关政策的制度保障,促进超级计算中心的可持续发展。(1)对
26、科学研究计算资源,建议政府采用集中购买高性能计算服务方式,并形成可考核、可量化的、有限度的支持科学研究的方式, 形成财政对高性能计算支持的长效机制。(2)对科技管理部门支持的科学研究和创新开发专项中,对高性能计算有需求的科研项目,以政策安排的方式,指定由中心提供计算资源,为项目工作提供高性能计算支撑。(3)在信息产业扶持方面,设立高性能计算研究和相关软件开发的项目预算,持续支持高性能计算的研究和创新,支持高端应用软件的开发工作。结语本研究通过对当前国内外超级计算中心的总结,发现应用效率、人才集聚以及经济带动等方面成为了我国超算中心发展中的软肋。为解决这些问题,本文不仅建议超算中心本身需要总结提
27、升,还从外部环境的角度对促进超算中心发展从建设模式、组织机制以及政策保障等方面提出建议,为未来超算中心建设和发展提供借鉴。冯桂安 国家注册咨询工程师。上海投资咨询公司高级项目经理。主要研究方向为电子政务、高性能计算。。林新华 CCF会员。上海交通大学高性能计算中心副主任。主要研究方向为高性能计算。。参考文献 1www.xsede.org2Satoshi Matsuoka. The future of Tsubame Supercomputer and the Japanses HPCI towards Exascale. 2013.5.3www.prace-project.eu4钱德培。R&D on HPC and Grid in Chinas High-tech Program. 2010.115Earl C.Joseph, Chirag Dekate, Steve Conway. How nations are applying high-end Petascale Supercomputers for innovation and economic advancement in 2012. August 2010, IDC #236541, vOLUME:1 10