香港理工大学高等研究院 研究与创新公共论坛: 杨红霞教授主讲「DeepSeek及更远的未来」
香港理工大学高等研究院 研究与创新公共论坛

-
日期
2025年3月11日
-
主办单位
香港理工大学高等研究院
-
时间
15:00 - 16:30
-
地点
香港理工大学「赛马会综艺馆」
讲者
杨红霞教授
查询
香港理工大学高等研究院 info.pair@polyu.edu.hk
摘要
讲座摘要
DeepSeek 最近的发布证明不需要特别大的模型也能实现很强的 AI 能力。他们做出的 AI 模型性能可以跟美国顶尖的 AI 相比,但用的计算资源却少很多。更重要的是,他们选择开源的方式分享技术。这个发现改变了大家对开发 AI 的认识,这也引发了大家对隐私安全、技术竞争等问题的思考。我们的生成式 AI(Co-GenAI)项目就想借鉴这种思路,帮助香港提升 AI 竞争力。我们的平台拥有三大创新特点。首先是领域适应持续预训练系统,它能让 AI 模型通过学习特定领域的数据(比如企业和科研领域)变得更专业,训练效果通常优于开源模型和 ChatGPT。其次是高级模型融合系统,它通过在现有专业模型上构建「融合」模型的方式,大大节省了计算资源——训练 7B 模型只需 64–128 张显卡,100B 大模型仅需 512–1024 张显卡,节省超过 90% 的资源。第三是节省资源的架构设计,让我们能够利用数码港、科学园和鹏城实验室等地的普通计算资源来开发 AI,通过组合小模型的方式高效训练大模型,避免了传统方法中需要大量相同高端显卡的问题。这种创新方法让 AI 开发变得更容易上手,不再需要超大规模的集中计算资源。这个项目有望帮助香港在全球生成式 AI 发展中占据重要地位。

杨红霞教授
杨红霞教授是一位杰出的人工智能科学家,拥有超过15年的经验,专注于大规模机器学习、数据挖掘和深度学习。在她卓越的职业生涯中,杨教授开发了十套重要的算法系统,提升了多家企业的运营效率。她的研究重点包括预训练模型、大数据分析,以及大语言模型系统在实际环境中的应用。
杨教授学术成就斐然,至今发表了顶级论文100多篇,引用次数约12,000次,H指数为46。她还拥有50多项专利。她于其专业领域的贡献获多项殊荣肯定,包括2019年世界人工智能大会的「卓越人工智能引领者奖」和2020年国家科学技术进步奖。
杨教授于2022年获评选为「福布斯中国科技女性50强」之一,并于2023及2024年入选「人工智能全球2000位最具影响力学者」名录。她在字节跳动和阿里巴巴创立了基础模型团队,并曾在雅虎公司和IBM T.J. 沃森研究中心担任重要职务。
杨教授拥有美国杜克大学博士学位和中国南开大学学士学位。她在生成式人工智能领域被公认为全球先驱。