PAIR Public Forum for Research and Innovation: Prof. YANG Hongxia of PolyU delivers "DeepSeek and Beyond"
校友

-
日期
2025年3月11日
-
主办单位
香港理工大学高等研究院
-
时间
15:00 - 16:30
-
地点
香港理工大学「赛马会综艺馆」
查询
香港理工大学高等研究院 info.pair@polyu.edu.hk
摘要
讲座摘要
DeepSeek 最近的发布证明不需要特别大的模型也能实现很强的 AI 能力。他们做出的 AI 模型性能可以跟美国顶尖的 AI 相比,但用的计算资源却少很多。更重要的是,他们选择开源的方式分享技术。这个发现改变了大家对开发 AI 的认识,这也引发了大家对隐私安全、技术竞争等问题的思考。我们的生成式 AI(Co-GenAI)项目就想借鉴这种思路,帮助香港提升 AI 竞争力。我们的平台拥有三大创新特点。首先是领域适应持续预训练系统,它能让 AI 模型通过学习特定领域的数据(比如企业和科研领域)变得更专业,训练效果通常优于开源模型和 ChatGPT。其次是高级模型融合系统,它通过在现有专业模型上构建「融合」模型的方式,大大节省了计算资源——训练 7B 模型只需 64–128 张显卡,100B 大模型仅需 512–1024 张显卡,节省超过 90% 的资源。第三是节省资源的架构设计,让我们能够利用数码港、科学园和鹏城实验室等地的普通计算资源来开发 AI,通过组合小模型的方式高效训练大模型,避免了传统方法中需要大量相同高端显卡的问题。这种创新方法让 AI 开发变得更容易上手,不再需要超大规模的集中计算资源。这个项目有望帮助香港在全球生成式 AI 发展中占据重要地位。
香港理工大学计算机及数学科学学院副院长(环球事务)及电子计算学系教授
杨教授学术成就斐然,至今发表了顶级论文100多篇,引用次数约12,000次,H指数为46。她还拥有50多项专利。她于其专业领域的贡献获多项殊荣肯定,包括2019年世界人工智能大会的「卓越人工智能引领者奖」和2020年国家科学技术进步奖。
杨教授于2022年获评选为「福布斯中国科技女性50强」之一,并于2023及2024年入选「人工智能全球2000位最具影响力学者」名录。她在字节跳动和阿里巴巴创立了基础模型团队,并曾在雅虎公司和IBM T.J. 沃森研究中心担任重要职务。
杨教授拥有美国杜克大学博士学位和中国南开大学学士学位。她在生成式人工智能领域被公认为全球先驱。