用小容器裝載大數據
香港理工大學研究團隊首創
以突破性新方法存儲數據
科學家提及多肽,一般與生物醫學研究以及新藥物的研發有關。現在,香港理工大學一個研究團隊卻以截然不同的目的研究多肽——利用多肽作為存儲大量數據的媒介。
根據國際數據資訊有限公司的資料,人類於全球生產的數據正急速增長,即將從 2018年的33 個澤位元組 (zettabyte 或 ZB) 增長至 2025年的 175 個澤位元組。(註:每個澤位元組約相等於十億個太位元組 (terabyte 或 TB)或一兆個吉位元組(gigabyte 或 GB))。
這種現象衍生了一個問題,就是我們應如何存儲所有數據?現今大部分磁存儲裝置均未能提供足夠容量,並且只能保存 10 至 20 年。
理大一個研究團隊為此提供了一個解決方案。團隊由理大應用生物及化學科技學系副教授姚鍾平博士與電子及資訊工程學系副系主任劉重明教授帶領,另香港科技大學及香港中文大學的研究人員亦參與這個嶄新的革命性項目。
將數據轉換成多肽
姚鍾平博士及劉重明教授的研究,是首次使用多肽作為存儲媒介。相比現有的數據存儲裝置,以及去氧核糖核酸 (DNA)數據存儲等研發中的技術,多肽存儲密度更高,穩定性更強,可存放數百萬年之久。
用這個新方法存儲數據,首先要將原始數據編碼,成為0和1組成的長字符串,然後轉換成多肽序列,最終合成多肽以粉狀或溶液進行存儲。要回讀數據時,則利用串聯質譜等技術給多肽測序,然後將其解碼為原始數據。當這項技術發展成熟的時候,即使是等同於國家圖書館全部藏書的大數據,也可裝載於多肽小樽內,所佔用的體積僅有如鞋盒的大小。
多肽究竟是甚麼? |
發揮影響力
團隊已經為新發明申請專利。雖然如此,他們仍然需要克服挑戰,包括讀取及寫入數據的高昂成本以及測序所需的時間等;就日常運用而言,現時測序的速度還是過於緩慢。
研究團隊為克服這些挑戰訂立了明確目標,包括繼續提升數據密度、設計更佳的編碼方案,以及存儲更大容量的數據等。
在達致目標的過程當中,團隊喜獲大學教育資助委員會研究影響基金撥款超過970萬港元。撥款證明,香港理工大學在這個範疇的領導地位與專長得到肯定。
這個項目未來的重要發展,與太空探索息息相關;因為在太空旅程當中,必須長時間於密封範圍內存儲及管理大量數據。事實上,隨著2020年5月5日中國「長征五號B」運載火箭搭載的新一代載人飛船升空,這個過程已經展開。飛船將多肽存儲的信息載入太空,包括理大校訓「開物成務 勵學利民」以及「理大八十周年校慶」等信息。是項實驗之目的,是驗證當多肽被置於太空環境後,其可靠性及穩定性有否受到影響。當飛船帶著實驗物料安全重返地球後,理大團隊將進一步讀取及分析所回收的數據。
現在,團隊正熱切期待與跨國科技企業及其他夥伴機構合作,並發展項目的商業用途。
邁進數據存儲的新紀元
未來數年,這個項目可望在測序優化、軟件開發、實際數據存儲與讀取等方面取得新進展。
正如姚鍾平博士指出:「能夠獲得機會繼續發展這個項目,令我們倍感振奮。我們深信,項目將對產生和儲存大量數據的政府及商業機構帶來莫大裨益。它具備巨大潛力,可為數據存儲以及管理的相關領域帶來翻天覆地的變化。」
姚鍾平博士(中)、劉重明教授(左二) 與部分研究人員,包括伍卓知博士 (左)、譚偉文博士(右一) 及蘇培堅博士(右二)