Skip to main content Start main content

香港理工大學高等研究院 研究與創新公共論壇: 楊紅霞教授主講「DeepSeek及更遠的未來」

香港理工大學高等研究院 研究與創新公共論壇

20250311 Lecture on DeepSeek by Prof YANG Hongxia1000 x 540 px
  • 日期

    2025年3月11日

  • 主辦單位

    香港理工大學高等研究院

  • 時間

    15:00 - 16:30

  • 地點

    香港理工大學「賽馬會綜藝館」  

講者

楊紅霞教授

查詢

香港理工大學高等研究院 info.pair@polyu.edu.hk

摘要

講座摘要

DeepSeek 最近的發布證明不需要特別大的模型也能實現很强的 AI 能力。他們做出的 AI 模型性能可以跟美國頂尖的 AI 相比,但用的計算資源卻少很多。更重要的是,他們選擇開源的方式分享技術。這個發現改變了大家對開發 AI 的認識,這也引發了大家對隱私安全、技術競爭等問題的思考。我們的生成式 AI(Co-GenAI)項目就想借鑒這種思路,幫助香港提升 AI 競爭力。我們的平臺擁有三大創新特點。首先是領域適應持續預訓練系統,它能讓 AI 模型通過學習特定領域的數據(比如企業和科研領域)變得更專業,訓練效果通常優於開源模型和 ChatGPT。其次是高級模型融合系統,它通過在現有專業模型上構建「融合」模型的方式,大大節省了計算資源——訓練 7B 模型只需 64–128 張顯卡,100B 大模型僅需 512–1024 張顯卡,節省超過 90% 的資源。第三是節省資源的架構設計,讓我們能夠利用數碼港、科學園和鵬城實驗室等地的普通計算資源來開發 AI,通過組合小模型的方式高效訓練大模型,避免了傳統方法中需要大量相同高端顯卡的問題。這種創新方法讓 AI 開發變得更容易上手,不再需要超大規模的集中計算資源。這個項目有望幫助香港在全球生成式 AI 發展中佔據重要地位。

YANG Hongxia

楊紅霞教授

香港理工大學計算機及數學科學學院副院長(環球事務)及電子計算學系教授

 

楊紅霞教授是一位傑出的人工智能科學家,擁有超過15年的經驗,專注於大規模機器學習、數據挖掘和深度學習。在她卓越的職業生涯中,楊教授開發了十套重要的算法系統,提升了多家企業的運營效率。她的研究重點包括預訓練模型、大數據分析,以及大語言模型系統在實際環境中的應用。

楊教授學術成就斐然,至今發表了頂級論文100多篇,引用次數約12,000次,H指數爲46。她還擁有50多項專利。她於其專業領域的貢獻獲多項殊榮肯定,包括2019年世界人工智能大會的「卓越人工智能引領者獎」和2020年國家科學技術進步獎。

楊教授於2022年獲評選爲「福布斯中國科技女性50强」之一,並於2023及2024年入選「人工智能全球2000位最具影響力學者」名錄。她在字節跳動和阿里巴巴創立了基礎模型團隊,並曾在雅虎公司和IBM T.J. 沃森研究中心擔任重要職務。

楊教授擁有美國杜克大學博士學位和中國南開大學學士學位。她在生成式人工智能領域被公認爲全球先驅。

您的瀏覽器不是最新版本。如果繼續瀏覽本網站,部分頁面未必能夠正常運作。

建議您更新至最新版本或選用其他瀏覽器。您可以按此連結查看其他相容的瀏覽器。