近日,由国防科技大学计算机学院为国家超算广州中心研制的新一代国产超级计算系统——“天河星逸”发布。“天河星逸”系统以应用为中心,在通用CPU计算能力、存储能力以及应用服务能力等多方面较“天河二号”实现倍增,进一步提升了国家超算广州中心多领域服务能力。
一代超级计算系统的背后,是国防科技大学超算团队从研究小组到国家战队、从打破垄断到世界第一、从攻关先锋到创新旗帜的奋斗足迹。
该校计算机学院领导表示,军队院校作为国防科技建设发展的主阵地、高水平军事人才培养的排头兵,唯有坚定信仰、迎难而上,才能勇立科技兴军潮头、勇担人才强军重任,才能破解现代战争制胜机理,为制胜未来战场提供有力支撑。
夺冠
天河的故事,总是与热血相伴。
“我们做了一件让自己满意的事,一件让中国人扬眉吐气的事!”2010年,“天河一号”首次登上世界超算之巅的那一刻,超算团队高高举起刻有“中国制造”的金色奖牌,让世界记住了“中国速度”。
然而,当国人还在为中国超算登顶世界之巅欢呼的时候,超算团队的这群军队科技工作者早已从聚光灯下离开,转身向实验室走去。他们的目光投向未来,投向世界强国超算决战的新战役。
2013年6月,“天河二号”超级计算机系统再登世界TOP500榜首!随后,天河超算拿下TOP500排名“六连冠”,用实力再一次向世界证明了自己。
自1993年5月被中央军委授予“科技攻关先锋”荣誉称号起,30多年过去了,国防科技大学计算机学院楼前那片以“银河”命名的广场,见证了团队夺冠的辉煌,更见证了团队在寂寞中坚守的漫长时光。
在新冠疫情最严重的时候,团队成员在这片广场上召开了一场又一场露天例会。计算机学院院长卢凯解释说:“银河例会是传统,项目的难点堵点都需要在会上协调沟通解决。当时工期紧,又因为疫情严重,不能开闭门会议,于是我想了这个办法。”
参与会议的科研参谋还留存着超算团队第一次露天开会的照片,背景是空旷无人的校园,大家隔着一定距离、围成一圈,耳朵冻得通红,但眼神都很明亮。
科研创新是孤独的苦旅,超算团队的目光瞄准世界最前沿,为求得最优解,他们常常要耗费几天、几个月、几年甚至几十年……
在率先采用CPU+GPU异构融合体系时,为了让“偷懒”的GPU跑起来,团队找来市场上20多种型号的GPU反复安装测试,光试型号就耗费了3个月。经过8万次优化改进后,他们将GPU的计算效率从国际公认的20%提高到70%,也令这条独创的技术路线一跃成为国际主流。
为搬开电互联技术路上的“绊脚石”,团队封闭攻关10个月,把性能提升到当时国际商用互联系统的两倍,又用1年时间自主研制出该系统最核心的两块芯片。团队成员说:“我们参加世界排名并不仅仅是为了第一,只有在国际上有了声誉,别人才愿意和我们交流。”
为攻克尖端技术难题,团队成员陈福接在身患肝炎的情况下,一边接受治疗一边在马扎上继续搞研究;没有先进的工具软件,手工绘图的芯片图纸铺开有几个足球场那么大,他们就这样趴在地上画图纸,一连几十天,腰背酸痛得站不起来……
突破
计算机学院某重点实验室主任吴研究员脚步轻快地在办公室与实验室之间穿梭。前不久,他所带领的小团队成员增至11人,新入职的同事拒绝了其他单位优厚的待遇,带着最前沿的研究成果加入团队。
“可能因为我们都是量子的粉丝吧。”吴研究员笑着解释团队吸引人才的原因。
和天河那样动辄几百人的团队规模相比,他们的团队称得上“迷你”。但这支团队在国际上最先开启“称霸标准”的研究、研发出新型光量子计算芯片、主持研制成功国际首台面向图论问题的光量子计算系统……
吴研究员在量子研究非常冷门的时候踏入该领域,从计算机到物理、数学,以完全转行的姿态带着三四个学生从无到有开始理论研究,一度多年没有成果产出。
“量子计算是未来趋势,是超算的一条新技术路线,哪怕再难,学院也支持我们走下去。”早在“天河一号”登上世界之巅时,计算机学院已经开始布局量子。“这山望着那山高”,似乎是从事超算研究的科研人员的共同特性。
这个“特性”由来已久。被称为“中国巨型计算机之父”的慈云桂提出搞巨型机时,我国正值动荡岁月,当时151每秒百万次中心处理机还在“鸭棚”里设计图纸,大家担心“盛到碗里的还没吃下”,慈云桂却意味深长地说:“我们不仅要吃着碗里的,看着锅里的,我们还要再想着米缸里的……那些远远走在我们前头的国家,现在都你追我赶,相互撵着跑。如果我们的目光只盯着脚趾前边那一小块地方,那么在世界计算机领地上,将永远没有中国人的一席之地!”
从百万次一跃到亿次,这需要跨越多少技术鸿沟?打开“银河-Ⅰ”的机柜,密密麻麻的布线看得人眼花缭乱,这是全手工的产物——全机底板2.5万条绕接线、12万个绕接点无一错漏;800多块多层印刷板上、每块板上平均5000个金属化孔全部通过测试;200多万个焊点无一虚焊。
其工作量之繁重复杂,最终完成效果之好,堪称奇迹。“每一代超算,都是一个时代的缩影。”吴研究员感叹说,“探索未来方向,瞄准未来布局,蹚出未来模式,是团队一直秉持的科研习惯。”
某型巨型机总师周兴铭追逐的是世界一流。那一年,他突然叫停大家干了大半年的单机处理方案,提出双处理机系统方案,但方案刚敲定,又发现国际前沿已经在尝试四处理机系统技术了,于是当机立断研制四处理机系统。面对“这么变来变去,要变到何时”的质疑,周兴铭力排众议:“要干就干一流的,这是我们团队的传统。”4年后,该型巨型机研制成功,速度比规定指标快了近3倍。
另一型号巨型机总师杨学军追求的是更大突破。当时大规模并行处理技术(MPP)路线刚刚冒头,不少团队因为这一前沿技术研制难、应用难都栽了跟头,但总师组仍然决定:“为了实现更大突破,接受挑战!”最终,该型巨型机速度比之前提高10倍,体积却只有其六分之一。
传承
20世纪50年代,由中国人自己设计研制的第一台电子管专用数字计算机诞生。这个年轻的科研小组,平均年龄只有25岁,他们争分夺秒,每天工作12小时,突击一年完成任务,人民海军的鱼雷快艇从此实现可全天候作战。
20世纪80年代初,正是我国物质匮乏、条件艰苦的时候,但首台亿次巨型机“银河-Ⅰ”研制成功仅用了5年。一群“拼了命也要干”的年轻人,用拼搏奋斗实现了我国巨型机零的突破。
“天上一条银河,地上一支‘银河’。”这是计算机学院超算团队成员常说的一句话。走过苦难辉煌的前辈们,在艰苦的环境里奉献青春,而后辈们身处宽敞明亮的实验室,站在前人的肩膀上眺望远方,他们能否持续攀登更高的山峰?后来者用实际行动给出了答案。
某型巨型机问世那年,黄春还是个“圆圆脸大眼睛”的姑娘,正在计算机学院读大二的她为机房值夜岗。灯火通明的深夜,老师们伏案加班的身影成为她记忆中难忘的画面。研究生毕业后,她如愿进入编译领域,伴随着一代代机器的发展,逐渐从科研新手成长为超算团队的核心骨干。
超算人的创新之路,始终洒满了热情奋斗的汗水,也吸引着90后、00后青年学子源源不断汇聚而来。
前年博士毕业留校的陈助理研究员就是其中一员。7年前,他从地方大学来到国防科大,“超级计算机是国家信息技术创新的核心驱动,同时也是快速发展高端信息技术的‘牛鼻子’。”导师的话让他决定了未来的研究方向。此后,深夜12点后离开实验室是他工作的常态。
在获得攻博资格那年,陈助理研究员开始参加某型超算系统升级工作。“许多技术难题,都是在深夜三四点攻破的。”他说,团队每两天举行一次研讨会,细抠算法的每一处性能细节,大家针对瓶颈问题“吵”出一个个切实可行的方案。最终,团队成功开发出一套高效算法,使得系统性能实现大幅提升。
陈思 颜瑾 何智明 中青报·中青网记者 王裴楠