对于关心天气预报的人们,这是一则破天荒的消息:中国人终于拥有了国产超算、国产模式、国产数据“三合一”的国产气象高性能计算机系统。前不久,这台名为“派-曙光”的国之重器通过业务验收,正式“上岗”。
对很多年轻的手机发烧友来说,购买手机首先要看它的硬件配置:希望它处理器更强,打游戏流畅无阻,存储空间大,还能兼容市面上大多数应用程序,而且用起来省电,最好不要发热。
而对全球主要的气象机构来说,他们对高性能计算机的需求,就和这些发烧友对手机的需求很是相似——架构更先进、计算能力更强、存储容量更大、更加绿色节能,可有效支持海量数据的处理和众多模式的运转,帮助气象部门更快地研究制作发布更加精准的天气预报。
当然,和手机一样,高性能计算机也有自己的“服役期限”,这个周期大约为6~8年,也正因如此,全球主要气象机构高性能计算机更新换代的新闻频频见诸报端。如今,我国天气预报“大脑”也迎来了更新换代,而上一次还是4年前的事,那时还是引进的“进口货”。
天气预报需要超算有多“硬核”
高性能计算机系统,还有一个更为人熟知的名字——超级计算机,或者超算。自2013年以来连续登陆全球最强超级计算机榜首,国产超算包括硬件、应用等在内的优越性能便广为人知。
但很多人不了解,每天服务于人们生产生活的天气预报,对超算的需求有多么迫切和严苛。
中国科学院院士、中国科学院大气物理研究所研究员曾庆存说,预测未来一个月、一年,甚至几十年的气候,关系到国民经济建设方方面面,如夏季洪涝、冬季雾霾、农业规划、能源布局等,在全球变暖的背景下,气候预测愈显重要。但是,预测天气和气候却是世界上最复杂的问题之一。
古人看云识天:天上钩钩云,地上雨淋淋。这是过去的天气预报——凭个人经验。到了20世纪,人们已发明和应用了气象仪器来测量大气状态,气象学开始进入“科学时代”。曾庆存说,特别是无线电的应用,使各地的气象观测数据能及时汇总到一个中心,绘成“天气图”,但天气图还是严重依赖预报员的主观判断。
从20世纪50年代开始,数值模式预报方法取得了成功。然而,60多年来,人们所需的气象预报时空精度越来越高,数值模式已经从一个简单的正解方程发展到世界上最复杂的软件项目之一,海量数据和数百万条代码总能轻易占满计算设备的所有可用资源。
中国气象局最近一次提出的“计算”需求是:高性能计算系统峰值运算速度要不低于8000万亿次每秒,内存容量每1个CPU核,至少对应6GB内存,在线存储容量要大于12.6PB,全系统可用度超过99%,等等。
时值国产超算蓬勃发展,已接连在全球最强超级计算机榜单中“拔得头筹”。这套国产高性能计算机系统以超出预期的性能令人眼前一亮——
峰值运算速度达到每秒8189.5万亿次,约为此前中国气象局使用的进口高性能计算机系统的8倍;内存总容量达到690432GB;在线存储物理容量为23088TB;全系统可用度超过99%,等等,无一例外都达到了预期。
据“派-曙光”相关负责人透露,在系统架构上,它有两套子系统互相备份,计算资源相对独立,共享存储资源。“如此一来,即便其中一套出现故障,另一套会提供同样的支持,气象业务可靠性大大提高”。
如何造就一颗气象“最强大脑”
该负责人还提到,为了支持气象新领域的研究和适应未来高性能计算机系统的发展,科研人员还在这套高性能计算系统中特意配置了小规模试验子系统,支持相关研发与试验,希望借此为将来天气气候模式在异构平台的移植提供实验环境。
“国产超算助力气象业务运行,这不是第一次,也绝不是最后一次。气象强国与国产超算的未来,都值得期待。”该负责人说。
当然,要发挥这套高性能计算机系统强大的计算能力,有一个问题无法回避:那就是如何合理调配资源,既不让它们“打架”,又不让计算资源浪费,同样是一门大学问。
在这套高性能计算机系统上,运行着众多的气象业务系统。它如同一个巨大的生产车间,而各个节点则相当于工人,一起在车间里劳动。这个车间的调度者需要一个高效率的指挥工具,这样才能站在全局高度,指挥各个“工人”分工合作,发挥出最高的生产效率。
一个名为“Gridview”的作业调度软件,就是这套高性能计算机系统的“指挥工具”,提供调度策略、业务流程监控。
截至目前,来自我国“风云”系列国产气象卫星的数据,已经全面应用到这台国产高性能计算机系统所支持的业务和科研作业中。
按照曾庆存的说法,目前的“3天天气预报”,已在全球范围达到70%至80%的准确度,如果是一定区域,比如我国华南地区的“3天天气预报”,准确度能高于80%。同时,国际上天气预报的有效性已从早期的1~3天提高到5~7天。
在2018年9月到11月短暂的试运行期间,这套国产高性能计算机系统更是扛起了包括冬奥气象模式运行、全国水平分辨率200m风能资源图谱制作、全球大气再分析产品研制等在内的多项业务、科研重担。
这其中,在2018年“玛丽亚”“安比”“山竹”等台风预报中,这套国产设备已为全国天气预报会商提供了“不可取代的作用”。
“如今,我们已经能把台风信息牢牢掌握住了。”曾庆存说,近年来,多个台风的24小时预报登陆点和实际登陆点相差50公里左右——台风半径是1000公里,看相对值的话,50公里已经是很小的误差范围了。
中国青年报·中青在线记者 邱晨辉