Skip to main content Start main content

融合機器學習與整體網絡可控性分析 精確識別癌症治療標靶

2025年3月20日

研究及創新

控制樞紐及敏感控制樞紐圖解

在癌症基因調控網絡(GRN)中識別CKG和sCKG

細胞株及老鼠模型實驗結果


透過分析大量生物數據,機器學習可加速識別整體可控性網絡中對網絡結構變化敏感的關鍵控制樞紐,並將其作為疾病與癌症治療的潛在診斷生物標記及治療靶點。
  
基因突變是導致癌症的主要原因。研究癌症的焦點一直是識別有可能引發腫瘤,或促進異常細胞生長的「癌症驅動基因」(CDG)。目前,對人類癌症的大規模測序,旨在徹底找出賦予癌細胞選擇優勢的突變基因。然而,因為各類癌症差異甚大,加上不同的癌症乃由不同的基因突變組合所催生,因此CDG尚未有一套廣受接納的黃金標準。
 
香港理工大學(理大)醫療科技及資訊學系系统生物學和人工智能講座教授、全球STEM學者、理大高等研究院副院長章偉雄教授領導的研究團隊採取了不同的方法,成功識別出維持癌細胞狀態的關鍵基因,並命名為「癌症守護基因」(CKG)。與驅動基因不同,其突變時會直接導致癌症形成及擴散,而守護基因則是維持細胞穩態及存活的關鍵。針對CKG的干預措施,可以終止或防止異常細胞分化及增殖,因此CKG可作為診斷和治療癌症的理想生物標記和靶點。這項題為「癌症守護基因作為治療標靶」(Cancer-keeper genes as therapeutic targets)的研究已刊載於iScience。 

研究團隊利用機器學習技術構建了一個「基因調控網絡」(GRN),以拓展整體網絡可控性的理論,並開發出能夠有效識別CKG的演算法。這一概念基於控制理論,尤其適用於以圖形結構呈現的系統,當中的節點代表實體,邊緣則代表相互作用。在一個完全可控的網絡中,能夠運用一組適用於特定節點的有限控制輸入來控制所有節點的狀態。這個概念在電氣工程領域,用來描述電網及運輸網絡。 

在生物系統領域,這項分析有助於識別能夠影響整個網絡行為的關鍵組件或「控制樞紐」,使其成為治療干預的理想選項。研究團隊根據蛋白質相互作用的數據,以及描述基因之間調控關係的訊號路徑資訊,構建了一個GRN。該網絡由癌症相關基因(作為種子節點)及捕捉基因之間相互作用的邊緣組成,可橫跨從五個疾病及癌症相關通路資料庫中,挑選出十條重要的訊號通路。

在這項研究中,研究團隊將控制樞紐視為候選的異常細胞CKG,並發現某些控制樞紐可能較敏感,更容易受到外部干擾。這類控制樞紐正是團隊的研究重點,當單一邊緣以干擾形式從網絡中被移除時,這些控制樞紐就有機會變成非控制樞紐。這種敏感的CKG(sCKG)被視為更佳的治療靶點。

機器學習技術適用於探索大量遺傳數據,以建立生物網絡,並識別出網絡中較不明顯的模式及關聯。研究團隊開發了一套創新的多項式時間演算法,無需計算網絡中所有的控制方案,即可識別出所有控制樞紐。該演算法會首先識別所有控制方案中控制路徑的頭、尾節點,然後再識別出控制樞紐。這項分析有助於發掘網絡中控制系統行為的重要節點,使其成為合適的治療標靶候選。
 
研究團隊應用CKG方法,構建了一個包含7,030個節點(基因)及103,360條定向邊緣組成的膀胱癌GRN。透過機器學習分析,共識別出660個節點為控制樞紐(CKG),而當中只有173個節點被歸類為sCKG。進一步對比人體細胞內蛋白質相互作用的網絡時,發現共有35個sCKG可作為潛在的治療標靶。值得注意的是,在膀胱癌中,所有涉及細胞週期和p53路徑相關的基因均被識別為CKG。此外,細胞株及老鼠模型實驗證實,共有六種敏感CKG可有效抑制癌細胞生長。
 
本研究所構建的調控網絡,是一種適用於網絡可控性的泛癌症基因調控網絡。不僅可以使用針對某種癌症特有的種子基因外,還能透過移除相斥基因和在不同條件下檢測到的相互作用來修改網絡,以針對其它癌症。此外,運用整體網絡可控性分析的方法,還可進一步應用於識別SARS-CoV-2傳染病等其他疾病的控制樞紐。
 
資訊來源: PolyU Innovation Digest
 

您的瀏覽器不是最新版本。如果繼續瀏覽本網站,部分頁面未必能夠正常運作。

建議您更新至最新版本或選用其他瀏覽器。您可以按此連結查看其他相容的瀏覽器。