Skip to main content Start main content

香港理工大学高等研究院 研究与创新公共论坛: 杨红霞教授主讲「DeepSeek及更远的未来」

香港理工大学高等研究院 研究与创新公共论坛

Recap of PAIR Public Forum by Prof YANG Hongxia 1000 x 540 pxSC
  • 日期

    2025年3月11日

  • 主办单位

    香港理工大学高等研究院

  • 时间

    15:00 - 16:30

  • 地点

    香港理工大学「赛马会综艺馆」  

讲者

杨红霞教授

查询

香港理工大学高等研究院 info.pair@polyu.edu.hk

摘要

讲座

DeepSeek 最近的发布证明不需要特别大的模型也能实现很强的 AI 能力。他们做出的 AI 模型性能可以跟美国顶尖的 AI 相比,但用的计算资源却少很多。更重要的是,他们选择开源的方式分享技术。这个发现改变了大家对开发 AI 的认识,这也引发了大家对隐私安全、技术竞争等问题的思考。我们的生成式 AI(Co-GenAI)项目就想借鉴这种思路,帮助香港提升 AI 竞争力。我们的平台拥有三大创新特点。首先是领域适应持续预训练系统,它能让 AI 模型通过学习特定领域的数据(比如企业和科研领域)变得更专业,训练效果通常优于开源模型和 ChatGPT。其次是高级模型融合系统,它通过在现有专业模型上构建「融合」模型的方式,大大节省了计算资源——训练 7B 模型只需 64–128 张显卡,100B 大模型仅需 512–1024 张显卡,节省超过 90% 的资源。第三是节省资源的架构设计,让我们能够利用数码港、科学园和鹏城实验室等地的普通计算资源来开发 AI,通过组合小模型的方式高效训练大模型,避免了传统方法中需要大量相同高端显卡的问题。这种创新方法让 AI 开发变得更容易上手,不再需要超大规模的集中计算资源。这个项目有望帮助香港在全球生成式 AI 发展中占据重要地位。

摘要

香港理工大学(理大)高等研究院今日举办首场「研究与创新公共论坛」,以「DeepSeek及更远的未来」为主题,由计算器及数学科学学院副院长(环球事务)及电子计算学系教授杨红霞教授担任主讲嘉宾,深入探讨人工智能的最新发展。论坛吸引逾千名师生、校友、创科界领袖、学界翘楚和公众人士出席,以及逾39万人次透过多个平台观看直播。

论坛由理大高等研究院院长兼建筑环境及能源工程学系建筑热科学讲座教授陈清焰教授致辞,为活动揭开序幕,并由理大数据科学及人工智能学系讲座教授兼深圳研究院院长张成奇教授介绍讲者。张教授表示:「在人工智能浪潮下,发展大模型成为了各国、各企业竞争的核心。DeepSeek以较低阶、数量较少的尖端图像处理器芯片训练出高效能的人工智能模型,证明了强大的人工智能技术能够透过优化算法来实现。」

中国内地初创公司DeepSeek开发的人工智能大模型,凭借低成本、高效能及开源模型的优势在全球获得广泛赞誉,颠覆了传统人工智能模型训练「演算力至上」的逻辑。杨教授于论坛中强调生成式人工智能的潜力,并表示:「生成式人工智能为医疗、金融、制造、零售物流、媒体和时尚等各行业领域带来了庞大机遇,可应用于医学影像分析、欺诈检测、预测性维护、库存管理、内容创作、设计及营销等。」

她亦回顾了人工智能发展的历史,与观众分享了她在职业生涯中取得的成就,当中包括M6大模型的开发,验证仅使用512块图形处理单元(GPU)即可训练出具有十万亿参数的模型的可行性。杨教授也分享其生成式AI(Co-GenAI)项目如何提高人工智能技术的可及性,并减少对大规模集中计算资源的依赖,彻底改变人工智能的发展,助香港和内地在全球生成式人工智能发展中占据领先地位。

随后的讨论环节由张成奇教授主持,杨红霞教授以及理大电子计算学系系主任、数据科学讲座教授兼旅游业数字化转型研究中心联合主任李青教授,就人工智能发展为高等教育和研究带来的机遇及挑战分享真知灼见,并在问答环节中跟与会者进行深入交流。探讨议题围绕人工智能在业界的应用、信息监管、对就业环境及经济发展的影响,以及人工智能技术融合等。

理大一直致力推动人工智能教育和研究,并于今年一月成立计算器及数学科学学院,通过卓越教育、研究和知识转移,引领全球数码转型和人工智能的创新进步。

重温

YANG Hongxia

杨红霞教授

香港理工大学计算机及数学科学学院副院长(环球事务)及电子计算学系教授

 

杨红霞教授是一位杰出的人工智能科学家,拥有超过15年的经验,专注于大规模机器学习、数据挖掘和深度学习。在她卓越的职业生涯中,杨教授开发了十套重要的算法系统,提升了多家企业的运营效率。她的研究重点包括预训练模型、大数据分析,以及大语言模型系统在实际环境中的应用。

杨教授学术成就斐然,至今发表了顶级论文100多篇,引用次数约12,000次,H指数为46。她还拥有50多项专利。她于其专业领域的贡献获多项殊荣肯定,包括2019年世界人工智能大会的「卓越人工智能引领者奖」和2020年国家科学技术进步奖。

杨教授于2022年获评选为「福布斯中国科技女性50强」之一,并于2023及2024年入选「人工智能全球2000位最具影响力学者」名录。她在字节跳动和阿里巴巴创立了基础模型团队,并曾在雅虎公司和IBM T.J. 沃森研究中心担任重要职务。

杨教授拥有美国杜克大学博士学位和中国南开大学学士学位。她在生成式人工智能领域被公认为全球先驱。

您的浏览器不是最新版本。如果继续浏览本网站,部分页面未必能够正常运作。

建议您更新至最新版本或选用其他浏览器。您可以按此连结查看其他相容的浏览器。