在11月举行的全球超级计算大会上,由清华大学地球系统科学系80后副教授付昊桓带领团队完成的“非线性大地震模拟”,获得国际高性能计算应用领域最高奖“戈登·贝尔”奖。这是基于“神威·太湖之光”超级计算机的应用第二次拿下该奖。
同样是在11月,“神威·太湖之光”超级计算机以每秒12.5亿亿次的峰值计算能力以及每秒9.3亿亿次的持续计算能力,再次斩获全球超级计算机排名榜单TOP500第一名。神威·太湖之光”背后的国家超级计算无锡中心,包括实习生在内共有100多名员工,研发人员平均年龄只有25岁。
世界最快计算机有多快
最快的计算机,速度到底有多快?29岁的国家超级计算无锡中心主任助理甘霖惯用的回答是:如果把200多万台最新款的普通电脑加起来,计算能力只能跟它打个平手;其1分钟的计算能力,相当于全球70多亿人同时用计算器不间断地计算32年。
与TOP500榜单着眼于高速计算硬件性能不同,“戈登·贝尔”奖更注重高性能计算应用水平,被誉为“超级计算领域的诺贝尔奖”。此次获奖的“非线性大地震模拟”首次实现了对唐山大地震发生过程的高分辨率精确模拟,准确地实现对地震发生过程的重现与预测。
甘霖说,这对未来地震灾害救援演习、预防预测等研究、地震高发区的各项设施进行合理规划都有重要意义。
1年前,“神威·太湖之光”团队的“千万核可扩展全球大气动力学全隐式模拟”首次获得“戈登·贝尔”奖时,实现了我国高性能计算应用在此大奖上零的突破。
让甘霖感到自豪的是,当时“戈登·贝尔”奖的6个提名中,基于“神威·太湖之光”的应用就占了3个。今年该奖提高了门槛,提名只有3个,“神威·太湖之光”的应用就占了两个。
清华大学教授、国家超级计算无锡中心主任杨广文介绍,经过1年半积极运营,“神威·太湖之光”已开展了众多应用课题,领域涉及天气气候、航空航天、先进制造、生物医药、新材料、新能源等20个方面,支持国家重大科技应用、先进制造等领域解算任务几百项,百万核以上应用上百个,千万核整机应用17个。
快速学习与大胆尝试是团队的优势
早在2015年夏天,以清华大学为主的科研团队就来到位于江苏省无锡市蠡园经济开发区的国家超级计算无锡中心。这群年轻人肩负着一个重要使命,要为这款完全国产化的超级计算机打造属于自己的系统。当年4月,美国政府宣布把与超级计算机相关的4家中国机构,列入限制出口名单,目的是要限制中国超级计算机的发展。
作为“神威·太湖之光”最早的用户,这个超算团队当时的工作环境简陋,甚至连空调都没有。他们面临的任务挑战也是艰巨的,“机器是全新的,硬件是全新的,软件与应用都不完善,只能迎难而上”,甘霖说,当时,唯一的优势就是这支年轻的团队,快速学习与大胆尝试是团队的优势。
编译器开发者团队的王冬,与超算最早的渊源也是从2015年开始的。从那之后的每个假期,王冬都几乎都在无锡度过,研发起步的阶段,机器刚落户,办公室还在装修,屋子里大风扇“呼哧呼哧”转着。直到2016年6月在德国法兰克福世界超算大会上“神威·太湖之光”计算机系统首次亮相,一举夺冠,王冬觉得“这段苦日子值了”。
对王冬来说,他几乎见证了“神威·太湖之光”成长的整个过程:从被欧美技术封锁,到研制出完全国产芯片,再到完全国产化的超算诞生,并成为具有全世界最快运算速度的计算机,最后获得国际高性能计算应用领域最高奖。王冬说,这是一个“彻底强大起来”的过程,中国的科学家们终于可以扬眉吐气,掌握主动权了。
家有梧桐,凤凰可栖
在超算团队里,并非所有人的工作都是“高大上”,但每个人的工作都必不可少。
24岁的云平台环境部工程师乔宇是大专生,面试时,他对云平台的使用提出了自己的见解,面试官对他的想法赏识有加,不久后他成为团队一员。
面对这个复杂的机器,乔宇的工作更像一个“翻译官”。他要敲代码,把超算专业的东西翻译得通俗易懂、简洁明了,再提供给用户。他的翻译工作能提高了用户体验。
拥有40960个芯片的“神威·太湖之光”所在的机房,除了空调声,没有任何噪音。尽管计算机系统采用了高效水冷技术、高密度的组装工艺等,但“神威·太湖之光”的运行仍需要一个专业的团队来保障。
25岁的常州工学院毕业生朱成龙就是其中一员。他所在的部门有17人,大部分都是90后,他们日常工作更像“保姆”,进行软件系统维护,随时准备应对突发事件。如今,朱成龙对这台机器了如指掌,如果遇到故障,能在最短时间内找到故障点,并迅速给出解决方案。
“我们的年轻人是科研攻关、维护运营、持续发展的中坚力量,许多重大应用都是他们刻苦钻研出来的。”杨广文感慨道。
家有梧桐,凤凰可栖。国家超级计算无锡中心在制度上也有诸多创新,打破大锅饭,激励创新,按劳分配,多劳多得;通过联合实验室方式,把各应用领域的人才团队聚集,在短时间内提升超算团队的人才需求;同时,积极与院校合作,优秀学生毕业后直接到无锡工作。
杨广文说,在“神威·太湖之光”的研制基础之上,已开展了对百亿亿次超算开发工作,计划于2020年前后完成该项工作,百亿亿次超级计算机又称E级机,其运算速度将是“神威·太湖之光”的10倍,其规模更大、运算速度更快。
“希望更多的年轻人能够加入进来。希望‘太湖之光’这个好‘鞍’,能找到好的‘千里马’来驾驭。”杨广文说。
本报无锡12月6日电