您的位置: 网界网 > 网络学院-服务器 > 正文

向中西部挺进 浪潮超算落户西北工业大学

2013年08月15日 15:52:42 | 作者:佚名 | 来源:比特网 | 查看本文手机版

摘要:2013年7月,国产超算天河2号代表中国再次登顶TOP500超算排行榜,实现IT中国梦。而在这一荣誉的背后,可以说中国高性能计算团队已经完成了原始积累,向着 向中西部挺进 浪潮超算落户西北工业大学

标签
专访
人物
超算
浪潮
中西部
HPC
高性能计算
超级计算机

2013年7月,国产超算天河2号代表中国再次登顶TOP500超算排行榜,实现IT中国梦。而在这一荣誉的背后,可以说中国高性能计算团队已经完成了原始积累,向着更快、更高、更强的目标再次出发。国产超算带来的荣耀不可否认,但中国超算的短板也非常明显。

第一,但不是完美

超算作为高性能计算领域的最高级表现形式,即使在现在,也是一个由成百上千个机柜组成的庞然大物。物理的特点决定了超算无法轻易移动,而且受地域影响很大。纵观中国超算在地理上的分布,东部沿海一带,以天津、上海、深圳为中心的超算群已经为当地的企业提供了比较丰富的计算资源;但广大中西部仍然是一块明显的短板。

西北工业大学-浪潮集团高性能计算联合实验室正式揭牌

中西部地区作为我国国防和工业重镇,拥有众多的科研院所和重点名牌高校,而这些单位对于超算的需求并不比东部少。为了解决广大中西部地区超算资源“僧多粥少”的现状,浪潮作为中国超算的“国家队”,率先向中西部地区挺进。

2013年7月4日,西北工业大学-浪潮集团高性能计算联合实验室在西北工业大学正式挂牌成立。而该实验室所面向的正式我国目前着力发展的航空、航天、航海(三航)领域,能够有效缓解目前中西部地区科研院所对计算资源的急切需求。

作为天河1A、神威蓝光以及天河2号等多套全球顶级超算的研发参与者和部署者,浪潮在异构超算领域中有着丰富的经验,而此次西北工业大学(西工大)与浪潮集团共同建立的超算实验室正是采用目前最新的异构体系——MIC众核架构,其峰值运算能力将达到80万亿次。在配置上,超算的每个节点配备两颗Intel Xeon E5-2600系列处理器以及三块Intel Xeon Phi融核协处理器,整体架构与天河2号一致,可以说就是一台缩小版的天河2号。当然,除了缓解中西部科研院所和高校对计算资源的渴求之外,此次两家单位在超算方面的合作还有进一步的追求。

超算三航应用短板明显

在实验室挂牌仪式中,来自航空领域的专家对目前超算在航空领域的现状作了细致的阐述,从应用层面细致分析了其中短板的所在。专家表示,目前,我国航空领域的总体水平与美国等先进国家相比,仍存在着两个10年的差距。

而这些差距表现在航空超算领域主要有以下三大方面:

1、 跨学科人才缺乏

如果想要在航空领域中用好超算,设备只是基础,更重要的是人才。目前,即能够掌握超算编程本领又能够了解各种飞行器设计原理的跨学科人才非常少。由于对彼此学科的缺乏了解,传统的计算机人才和航空设计人才在实际的协同工作中交流非常困难,大家都要从零学起,这就大大影响了工作的效率和进度。

2、 超算软件落后

硬件是基础,软件是超算的灵魂。随着超算架构的不断发展,传统的CPU在超算中的地位已经有所减弱,高性能的协处理器正在不断涌现。如何让工作负载流在上万个核心中合理分配并尽量避免相互等待等地效率现象是摆在新一代超算软件开发者面前的一个新难题。而即使在以纯CPU为核心的传统超算架构中,很多航空设计辅助软件也无法调动所有硬件资源,这就造成了大型超算往往要在应用时分拆成若干个小规模超算来使用的情况,大大降低了科研效率。

3、 应用与研发脱节

在现实的情况中,超算需求往往集中在科研单位,而研发能力往往是企业比较强。由于产业结合不够紧密,双方在合作方面仍然有很多障碍,这就导致了整个领域的发展不够迅速。

二十年的差距不是一朝一夕能够解决的,而超算作为一个刚刚起步的产业,其在三航领域所面临的问题也肯定不止这三个。但作为重点行业应用,解决这三大问题则能够很好的加速我国三航领域的发展,以最短的时间缩短中国与先进国家之间的差距,为实现更多的中国梦添砖加瓦。

新超算、新平台、新起点

针对这些超算在三航领域中的实际问题,浪潮与西工大的合作可谓开了一个好头,也可谓醉翁之意不在马。

在揭牌仪式之后的采访中,浪潮集团高性能服务器产品部总经理刘军表示:“浪潮集团选择西工大是有非常明确的理由的。西工大作为科技大省陕西最重要的学府,不仅在三航领域有着优良的传统,更在超算应用方面有着丰富的经验。浪潮与西工大的此次合作不仅是一拍即合的,更是有基础的;彼此的共同点非常多。

除了为西工大解决超算设备的燃眉之急,浪潮与西工大的合作的另一个重要目的在于培养更多的跨学科型人才。”

西工大作为知名学府,在包括计算机在内的多个学科都有着明显的优势,而此次联合实验室的成立则有助于帮助不同学科的同学们在一起,共同达成利用先进设备完科研项目的目标。以大学良好的学习氛围为基础,为跨学科型人才的培养创造条件,让更多人有机会更早的接触到跨学科合作,并积累经验,为我国超算未来在更多行业中的应用洒下种子。

当然,这些跨学科人才最终也会帮助科研院所、学校以及行业开发出执行效率更高,更适合大规模并行计算的软件,解决超算在三航领域应用中的应用短板。

另一方面,浪潮也期望借此次与西工大合作的契机,探索一条更高效的产学研一体化路径。

刘军表示:在实验室超算的部署实施过程中,浪潮采用了全新的ClusterEngine超算服务平台。这一平台借鉴了目前流行的PaaS[注](平台即服务[注])思路。ClusterEngine平台提供了多租户管理、预制计算模板、自助资源申请、资源快速创建等众多功能。让超算从以往的“高高在上”变为了一种类似云的服务,方便不同的科研院所共同使用(+微信关注网络世界),提高超算的利用率。同时,预制模板等众多自动化功能的加入也可以极大的降低对科学家IT技术水平的要求,让科研变得更纯粹,从一定程度上缓解目前跨学科型人才短缺所造成的弊端。

超算在中西部地区的发展是一个长远的发展计划,不是一蹴而就的。但面对中西部地区广大战略性科研院所的实际需求,这种云计算[注]的模式能够在最大程度上提升硬件的利用率,让一台超算惠及一个地区、一个行业。

同时,刘军表示:“为了方便科研,浪潮还在ClusterEngine平台中加入了计算过程的远程预览功能。在以往的科研活动中,科学家往往要等到计算结束才能看到最终的数据图表,如果最终的结果不是收敛在一个集合中,那么说明试验是不成功的,需要重新修改和调试。目前所遇到的困难在于,一个计算过程往往需要数小时、数天甚至数周才能得到结果,如果结果不够理想,那么这段时间的等待就白白浪费掉了。

ClusterEngine平台所加入所加入的计算过程远程预览功能能够很好的解决这一问题,该功能允许用户以图表的形式实时查看计算过程,如果发现计算正在向着发散的方向发展,那么用户可以及时停止计算并进行修改和调试,这就大大减少了研发所需的等待时间。”

一个看似并不复杂的功能反映出的是浪潮在超算科研领域中丰富的经验以及对用户诉求的深刻了解,以小创新带出大效果。

俗话说“三流企业做产品,二流企业做标准,一流企业做理念”。

显然,经过多年的积累,浪潮已经在超算应用领域有了自己的一套理念,能够以国人的智慧解决那些看似很难得到改善的问题。对于广大的中西部地区、三航领域以及浪潮自身来说,高性能计算联合实验室不仅是一个新平台,更是一个新起点。

* 本文为ChinaByte比特网原创内容,版权所有,转载请注明出处和原文链接,未经授权请勿用于商业用途。

参考资料

1.云计算:(Cloud Computing)描述了一种基于互联网的新的IT服务增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展而且经常是虚拟化的资源。云计算是继1980年代大型计算机到...详情>>

2.PaaS:平台即服务(Platform as a Service,简称)是一种云计算服务,提供运算平台与解决方案堆栈即服务。在云计算的典型层级中,平台即服务层介于软件即服务与基础设施即服务之间...详情>>

[责任编辑:网络学院 dangkexi2010@163.com]