中国存储系统的先行者

 首页   - 清华人物   - 内容

中国存储系统的先行者——记中国工程院新当选院士、清华大学计算机系教授郑纬民

学生记者 何思萌 记者 吕婷 摄影 李派 李柱石

郑纬民

走起路来健步如飞,上起课来激情澎湃,谈起研究来妙语连珠……你或许不太相信,年过七旬、白发苍苍的郑纬民现在仍是课题组里每天最早到达实验室的那个人。组里的师生笑称郑老师是位“模范生”,每次见他不是在实验室就是在会议现场,研讨、讲课、debug、攻克技术难关……在过去的几十年里,郑纬民唯一的爱好就是搞研发、带学生。

1965年,郑纬民考入清华大学自动控制系时,计算机还只是自动控制系的一个专业,算法、存储、系统等基础理论的研究,国内还比较落后,没有人能准确判断中国的计算机事业将有怎样的未来。

改革开放后,郑纬民先后前往美国、英国从事分布操作系统与函数语言编译研究。回国后聚焦计算机并行/分布处理研究,并率先在高性能存储领域深耕发力。

2016年,郑纬民及其团队参与的项目斩获有着世界超级计算应用领域“诺贝尔奖”之称的“戈登·贝尔奖”,实现了我国高性能计算应用成果在该奖项上零的突破。

2019年,郑纬民当选中国工程院院士

在存储系统领域,从一张白纸到世界领先,中国花了不到半个世纪,这一近乎奇迹的“逆袭”,郑纬民功不可没。

存储系统背后的团队

在足球场大小的机房里,密密麻麻存放着高速运转的设备,一台台超级计算机正在执行快速计算任务。“超级计算机”,顾名思义,拥有超大的数据存储容量和超快速的数据处理速度,其中所涉及的技术远比目之所及的庞大机器更为复杂。绕不过去的核心技术就有集群计算机设计、CPU设计、网格计算、高性能存储等等,层出不穷的难题摆在计算机系高性能计算研究所时任所长郑纬民面前,作为计算机系统结构学科带头人的他,毫不犹豫地将这些技术难题作为研究所的主攻方向,带领团队“啃最难啃的骨头”。

当整个行业醉心于研究各类复杂精巧的算法时,郑纬民敏锐地意识到数据存储技术将面临巨大挑战。上个世纪90年代起,他在国内率先开展网格存储系统关键技术研究,并一再打破国际存储公司的技术垄断。“计算、互联、存储三大部件组成一个大信息系统,存储越来越成为其中的核心问题。当下,存储已成为关系到国计民生和国家战略安全的关键信息基础设施之一。”郑纬民说。怎样才能迅速、完整且长久地保留数据?怎样才能在即使部分硬盘被损坏的情况下确保数据安全完整?郑纬民带领整个团队,逐一攻破存储系统的可扩展性、可靠性等一道道难关。

但他们并没有止步于此。在此基础上,能否用更少的空间储存更多的数据?有别于通过降低分辨率等直接“打包”压缩的方法,郑纬民及其团队提出了新的思路。“通常而言,备份越多,数据越不容易灭失,但需占用大量存储空间。比如一部电影,拷贝三份分别存储,那就多花费了200%的空间。但如果把电影切割成若干段进行存储,例如存储32段电影内容,并同时生成16段校验码,当任何一个部分出错时,可以根据校验码进行纠正,则只需要多花费存储校验码的空间,也就是多增加33%左右的空间。”郑纬民说。

这一思路为节约硬盘存储空间打开了新的大门,然而最困难的是要实现数据存储和校验的实时同步。数据受网络环境的影响很可能产生错误,对原数据进行校验非常重要,使得再次使用这部分数据时,可以重新计算校验码并与之前的进行对比验证。郑纬民说:“在将数据写入硬盘时,要对原数据计算校验码并一同传输,在很长一段时间内,国际上认为这两者是不可能实时完成的。”而郑纬民完成了这一创举。他研制的自维护存储系统,实现了数据存储和校验的实时同步,整体技术达到国际领先水平,目前已被成功应用到审计、公安、油田、电信、教育等行业及部门。

Copyright © 365在线体育投注 版权所有    粤123456789-1号