香港理工大学研究团队首创

以突破性新方法存储数据

 

科学家提及多肽,一般与生物医学研究以及新药物的研发有关。现在,香港理工大学一个研究团队却以截然不同的目的研究多肽——利用多肽作为存储大量数据的媒介。

 

根据国际数据资讯有限公司的资料,人类於全球生产的数据正急速增长,即将从 2018年的33 个泽位元组 (zettabyte 或 ZB) 增长至 2025年的 175 个泽位元组。(注:每个泽位元组约相等於十亿个太位元组 (terabyte 或 TB)或一兆个吉位元组(gigabyte 或 GB))。

 

这种现象衍生了一个问题,就是我们应如何存储所有数据?现今大部分磁存储装置均未能提供足够容量,并且只能保存 10 至 20 年。

 

理大一个研究团队为此提供了一个解决方案。团队由理大应用生物及化学科技学系副教授姚钟平博士与电子及资讯工程学系副系主任刘重明教授带领,另香港科技大学及香港中文大学的研究人员亦参与这个崭新的革命性项目。

 

将数据转换成多肽

姚钟平博士及刘重明教授的研究,是首次使用多肽作为存储媒介。相比现有的数据存储装置,以及去氧核糖核酸 (DNA)数据存储等研发中的技术,多肽存储密度更高,稳定性更强,可存放数百万年之久。

 

用这个新方法存储数据,首先要将原始数据编码,成为0和1组成的长字符串,然后转换成多肽序列,最终合成多肽以粉状或溶液进行存储。要回读数据时,则利用串联质谱等技术给多肽测序,然后将其解码为原始数据。当这项技术发展成熟的时候,即使是等同於国家图书馆全部藏书的大数据,也可装载於多肽小樽内,所占用的体积仅有如鞋盒的大小。

 

多肽究竟是甚么?
多肽是分子,包含著至少两个连在一起的氨基酸,是细胞、人体组织、蛋白质、酵素、荷尔蒙 (如胰岛素)以及毒素(如蜂毒)的基本组成部分。

 

发挥影响力

团队已经为新发明申请专利。虽然如此,他们仍然需要克服挑战,包括读取及写入数据的高昂成本以及测序所需的时间等;就日常运用而言,现时测序的速度还是过於缓慢。

 

Compared with other data storage devices, peptides offer much higher storage density, are more stable and can last for millions of years

相比起其他数据存储装置,多肽存储密度更高、稳定性更强,可存放数百万年之久。

研究团队为克服这些挑战订立了明确目标,包括继续提升数据密度、设计更佳的编码方案,以及存储更大容量的数据等。


在达致目标的过程当中,团队喜获大学教育资助委员会研究影响基金拨款超过970万港元。拨款证明,香港理工大学在这个范畴的领导地位与专长得到肯定。

 

这个项目未来的重要发展,与太空探索息息相关;因为在太空旅程当中,必须长时间於密封范围内存储及管理大量数据。事实上,随著2020年5月5日中国 “长征五号B“ 运载火箭搭载的新一代载人飞船升空,这个过程已经展开。飞船将多肽存储的信息载入太空,包括理大校训 “开物成务   励学利民" 以及 “理大八十周年校庆" 等信息。是项实验之目的,是验证当多肽被置於太空环境后,其可靠性及稳定性有否受到影响。当飞船带著实验物料安全重返地球后,理大团队将进一步读取及分析所回收的数据。

 

现在,团队正热切期待与跨国科技企业及其他伙伴机构合作,并发展项目的商业用途。

 

迈进数据存储的新纪元

未来数年,这个项目可望在测序优化、软件开发、实际数据存储与读取等方面取得新进展。

 

正如姚钟平博士指出:“能够获得机会继续发展这个项目,令我们倍感振奋。我们深信,项目将对产生和储存大量数据的政府及商业机构带来莫大裨益。它具备巨大潜力,可为数据存储以及管理的相关领域带来翻天覆地的变化。“

 

Dr Yao Zhongping (middle), Professor Francis Lau (second from left), with some researchers Dr Albert Ng (left), and (from right) Dr Tam Wai-man and Dr So Pui-kin

姚钟平博士(中)、刘重明教授(左二) 与部分研究人员,包括伍卓知博士 (左)、谭伟文博士(右一) 及苏培坚博士(右二)