Skip to main content Start main content

融合机器学习与整体网络可控性分析 精确识别癌症治疗标靶

2025年3月20日

研究及创新

控制枢纽及敏感控制枢纽图解

在癌症基因调控网络(GRN)中识别CKG和sCKG

细胞株及老鼠模型实验结果


透过分析大量生物数据,机器学习可加速识别整体可控性网络中对网络结构变化敏感的关键控制枢纽,并将其作为疾病与癌症治疗的潜在诊断生物标记及治疗靶点。
  
基因突变是导致癌症的主要原因。研究癌症的焦点一直是识别有可能引发肿瘤,或促进异常细胞生长的「癌症驱动基因」(CDG)。目前,对人类癌症的大规模测序,旨在彻底找出赋予癌细胞选择优势的突变基因。然而,因为各类癌症差异甚大,加上不同的癌症乃由不同的基因突变组合所催生,因此CDG尚未有一套广受接纳的黄金标准。
 
香港理工大学(理大)医疗科技及信息学系系统生物学和人工智能讲座教授、全球STEM学者、理大高等研究院副院长章伟雄教授领导的研究团队采取了不同的方法,成功识别出维持癌细胞状态的关键基因,并命名为「癌症守护基因」(CKG)。与驱动基因不同,其突变时会直接导致癌症形成及扩散,而守护基因则是维持细胞稳态及存活的关键。针对CKG的干预措施,可以终止或防止异常细胞分化及增殖,因此CKG可作为诊断和治疗癌症的理想生物标记和靶点。这项题为「癌症守护基因作为治疗标靶」(Cancer-keeper genes as therapeutic targets)的研究已刊载于iScience。 

研究团队利用机器学习技术构建了一个「基因调控网络」(GRN),以拓展整体网络可控性的理论,并开发出能够有效识别CKG的算法。这一概念基于控制理论,尤其适用于以图形结构呈现的系统,当中的节点代表实体,边缘则代表相互作用。在一个完全可控的网络中,能够运用一组适用于特定节点的有限控制输入来控制所有节点的状态。这个概念在电气工程领域,用来描述电网及运输网络。 

在生物系统领域,这项分析有助于识别能够影响整个网络行为的关键组件或「控制枢纽」,使其成为治疗干预的理想选项。研究团队根据蛋白质相互作用的数据,以及描述基因之间调控关系的讯号路径信息,构建了一个GRN。该网络由癌症相关基因(作为种子节点)及捕捉基因之间相互作用的边缘组成,可横跨从五个疾病及癌症相关通路数据库中,挑选出十条重要的讯号通路。

在这项研究中,研究团队将控制枢纽视为候选的异常细胞CKG,并发现某些控制枢纽可能较敏感,更容易受到外部干扰。这类控制枢纽正是团队的研究重点,当单一边缘以干扰形式从网络中被移除时,这些控制枢纽就有机会变成非控制枢纽。这种敏感的CKG(sCKG)被视为更佳的治疗靶点。

机器学习技术适用于探索大量遗传数据,以建立生物网络,并识别出网络中较不明显的模式及关联。研究团队开发了一套创新的多项式时间算法,无需计算网络中所有的控制方案,即可识别出所有控制枢纽。该算法会首先识别所有控制方案中控制路径的头、尾节点,然后再识别出控制枢纽。这项分析有助于发掘网络中控制系统行为的重要节点,使其成为合适的治疗标靶候选。
 
研究团队应用CKG方法,构建了一个包含7,030个节点(基因)及103,360条定向边缘组成的膀胱癌GRN。透过机器学习分析,共识别出660个节点为控制枢纽(CKG),而当中只有173个节点被归类为sCKG。进一步对比人体细胞内蛋白质相互作用的网络时,发现共有35个sCKG可作为潜在的治疗标靶。值得注意的是,在膀胱癌中,所有涉及细胞周期和p53路径相关的基因均被识别为CKG。此外,细胞株及老鼠模型实验证实,共有六种敏感CKG可有效抑制癌细胞生长。
 
本研究所构建的调控网络,是一种适用于网络可控性的泛癌症基因调控网络。不仅可以使用针对某种癌症特有的种子基因外,还能透过移除相斥基因和在不同条件下检测到的相互作用来修改网络,以针对其它癌症。此外,运用整体网络可控性分析的方法,还可进一步应用于识别SARS-CoV-2传染病等其他疾病的控制枢纽。
 
信息来源: PolyU Innovation Digest
 

您的浏览器不是最新版本。如果继续浏览本网站,部分页面未必能够正常运作。

建议您更新至最新版本或选用其他浏览器。您可以按此连结查看其他相容的浏览器。