Skip to main content Start main content

香港理工大学高等研究院 研究与创新公共论坛: 杨红霞教授主讲「DeepSeek及更远的未来」

香港理工大学高等研究院 研究与创新公共论坛

20250311 Lecture on DeepSeek by Prof YANG Hongxia1000 x 540 px
  • 日期

    2025年3月11日

  • 主办单位

    香港理工大学高等研究院

  • 时间

    15:00 - 16:30

  • 地点

    香港理工大学「赛马会综艺馆」  

讲者

杨红霞教授

查询

香港理工大学高等研究院 info.pair@polyu.edu.hk

摘要

讲座摘要

DeepSeek 最近的发布证明不需要特别大的模型也能实现很强的 AI 能力。他们做出的 AI 模型性能可以跟美国顶尖的 AI 相比,但用的计算资源却少很多。更重要的是,他们选择开源的方式分享技术。这个发现改变了大家对开发 AI 的认识,这也引发了大家对隐私安全、技术竞争等问题的思考。我们的生成式 AI(Co-GenAI)项目就想借鉴这种思路,帮助香港提升 AI 竞争力。我们的平台拥有三大创新特点。首先是领域适应持续预训练系统,它能让 AI 模型通过学习特定领域的数据(比如企业和科研领域)变得更专业,训练效果通常优于开源模型和 ChatGPT。其次是高级模型融合系统,它通过在现有专业模型上构建「融合」模型的方式,大大节省了计算资源——训练 7B 模型只需 64–128 张显卡,100B 大模型仅需 512–1024 张显卡,节省超过 90% 的资源。第三是节省资源的架构设计,让我们能够利用数码港、科学园和鹏城实验室等地的普通计算资源来开发 AI,通过组合小模型的方式高效训练大模型,避免了传统方法中需要大量相同高端显卡的问题。这种创新方法让 AI 开发变得更容易上手,不再需要超大规模的集中计算资源。这个项目有望帮助香港在全球生成式 AI 发展中占据重要地位。

YANG Hongxia

杨红霞教授

香港理工大学计算机及数学科学学院副院长(环球事务)及电子计算学系教授

 

杨红霞教授是一位杰出的人工智能科学家,拥有超过15年的经验,专注于大规模机器学习、数据挖掘和深度学习。在她卓越的职业生涯中,杨教授开发了十套重要的算法系统,提升了多家企业的运营效率。她的研究重点包括预训练模型、大数据分析,以及大语言模型系统在实际环境中的应用。

杨教授学术成就斐然,至今发表了顶级论文100多篇,引用次数约12,000次,H指数为46。她还拥有50多项专利。她于其专业领域的贡献获多项殊荣肯定,包括2019年世界人工智能大会的「卓越人工智能引领者奖」和2020年国家科学技术进步奖。

杨教授于2022年获评选为「福布斯中国科技女性50强」之一,并于2023及2024年入选「人工智能全球2000位最具影响力学者」名录。她在字节跳动和阿里巴巴创立了基础模型团队,并曾在雅虎公司和IBM T.J. 沃森研究中心担任重要职务。

杨教授拥有美国杜克大学博士学位和中国南开大学学士学位。她在生成式人工智能领域被公认为全球先驱。

您的浏览器不是最新版本。如果继续浏览本网站,部分页面未必能够正常运作。

建议您更新至最新版本或选用其他浏览器。您可以按此连结查看其他相容的浏览器。