香港理工大學高等研究院 研究與創新公共論壇: 楊紅霞教授主講「DeepSeek及更遠的未來」
香港理工大學高等研究院 研究與創新公共論壇

-
日期
2025年3月11日
-
主辦單位
香港理工大學高等研究院
-
時間
15:00 - 16:30
-
地點
香港理工大學「賽馬會綜藝館」
講者
楊紅霞教授
查詢
香港理工大學高等研究院 info.pair@polyu.edu.hk
摘要
講座
DeepSeek 最近的發布證明不需要特別大的模型也能實現很强的 AI 能力。他們做出的 AI 模型性能可以跟美國頂尖的 AI 相比,但用的計算資源卻少很多。更重要的是,他們選擇開源的方式分享技術。這個發現改變了大家對開發 AI 的認識,這也引發了大家對隱私安全、技術競爭等問題的思考。我們的生成式 AI(Co-GenAI)項目就想借鑒這種思路,幫助香港提升 AI 競爭力。我們的平臺擁有三大創新特點。首先是領域適應持續預訓練系統,它能讓 AI 模型通過學習特定領域的數據(比如企業和科研領域)變得更專業,訓練效果通常優於開源模型和 ChatGPT。其次是高級模型融合系統,它通過在現有專業模型上構建「融合」模型的方式,大大節省了計算資源——訓練 7B 模型只需 64–128 張顯卡,100B 大模型僅需 512–1024 張顯卡,節省超過 90% 的資源。第三是節省資源的架構設計,讓我們能夠利用數碼港、科學園和鵬城實驗室等地的普通計算資源來開發 AI,通過組合小模型的方式高效訓練大模型,避免了傳統方法中需要大量相同高端顯卡的問題。這種創新方法讓 AI 開發變得更容易上手,不再需要超大規模的集中計算資源。這個項目有望幫助香港在全球生成式 AI 發展中佔據重要地位。
摘要
香港理工大學(理大)高等研究院今日舉辦首場「研究與創新公共論壇」,以「DeepSeek及更遠的未來」為主題,由計算機及數學科學學院副院長(環球事務)及電子計算學系教授楊紅霞教授擔任主講嘉賓,深入探討人工智能的最新發展。論壇吸引逾千名師生、校友、創科界領袖、學界翹楚和公眾人士出席,以及逾39萬人次透過多個平台觀看直播。
論壇由理大高等研究院院長兼建築環境及能源工程學系建築熱科學講座教授陳清焰教授致辭,為活動揭開序幕,並由理大數據科學及人工智能學系講座教授兼深圳研究院院長張成奇教授介紹講者。張教授表示:「在人工智能浪潮下,發展大模型成為了各國、各企業競爭的核心。DeepSeek以較低階、數量較少的尖端圖像處理器晶片訓練出高效能的人工智能模型,證明了強大的人工智能技術能夠透過優化演算法來實現。」
中國內地初創公司DeepSeek開發的人工智能大模型,憑藉低成本、高效能及開源模型的優勢在全球獲得廣泛讚譽,顛覆了傳統人工智能模型訓練「演算力至上」的邏輯。楊教授於論壇中強調生成式人工智能的潛力,並表示:「生成式人工智能為醫療、金融、製造、零售物流、媒體和時尚等各行業領域帶來了龐大機遇,可應用於醫學影像分析、欺詐檢測、預測性維護、庫存管理、內容創作、設計及行銷等。」
她亦回顧了人工智能發展的歷史,與觀眾分享了她在職業生涯中取得的成就,當中包括M6大模型的開發,驗證僅使用512塊圖形處理單元(GPU)即可訓練出具有十萬億參數的模型的可行性。楊教授也分享其生成式AI(Co-GenAI)項目如何提高人工智能技術的可及性,並減少對大規模集中計算資源的依賴,徹底改變人工智能的發展,助香港和內地在全球生成式人工智能發展中佔據領先地位。
隨後的討論環節由張成奇教授主持,楊紅霞教授以及理大電子計算學系系主任、數據科學講座教授兼旅遊業數字化轉型研究中心聯合主任李青教授,就人工智能發展為高等教育和研究帶來的機遇及挑戰分享真知灼見,並在問答環節中跟與會者進行深入交流。探討議題圍繞人工智能在業界的應用、資訊監管、對就業環境及經濟發展的影響,以及人工智能技術融合等。
理大一直致力推動人工智能教育和研究,並於今年一月成立計算機及數學科學學院,通過卓越教育、研究和知識轉移,引領全球數碼轉型和人工智能的創新進步。
按此重溫

楊紅霞教授
楊紅霞教授是一位傑出的人工智能科學家,擁有超過15年的經驗,專注於大規模機器學習、數據挖掘和深度學習。在她卓越的職業生涯中,楊教授開發了十套重要的算法系統,提升了多家企業的運營效率。她的研究重點包括預訓練模型、大數據分析,以及大語言模型系統在實際環境中的應用。
楊教授學術成就斐然,至今發表了頂級論文100多篇,引用次數約12,000次,H指數爲46。她還擁有50多項專利。她於其專業領域的貢獻獲多項殊榮肯定,包括2019年世界人工智能大會的「卓越人工智能引領者獎」和2020年國家科學技術進步獎。
楊教授於2022年獲評選爲「福布斯中國科技女性50强」之一,並於2023及2024年入選「人工智能全球2000位最具影響力學者」名錄。她在字節跳動和阿里巴巴創立了基礎模型團隊,並曾在雅虎公司和IBM T.J. 沃森研究中心擔任重要職務。
楊教授擁有美國杜克大學博士學位和中國南開大學學士學位。她在生成式人工智能領域被公認爲全球先驅。