您现在的位置是: 学院新闻

bat365中国在线平台官方网站邀请Dongxu Li博士做前沿学术报告

编辑: 林婷    审核: 周连景    供稿: 潘利源    发布日期: 2024年10月28日 浏览次数:

dongxuli文章图片.png


应bat365中国在线平台官方网站邀请,Dongxu Li博士于2024年4月26日在bat365中国在线平台官方网站作题为“BLIP系列多模态模型工作简述”的报告。此次报告由bat365中国在线平台官方网站图像计算与感知智能研究所潘利源老师主持,研究所相关研究方向教师和研究生参加了学术报告。

由李博士参与的BLIP(Bootstrapping Language-Image Pre-training)系列模型在多模态人工智能领域取得了显著进展。BLIP模型通过结合语言和图像数据,能够在多个应用领域展现出强大的性能。例如,在图像描述生成、视觉问答和图像检索等任务中,BLIP模型都表现出了优异的效果。本次学术报告,李博士与在场的学院师生充分讨论了这一研究方向,介绍了多模态预训练、对比学习、跨模态注意力机制等技术,讲解了Q-Former的使用心得,并进一步探讨了多模态人工智能领域的最新进展和未来机遇。

通过这次学术报告,学院师生对多模态人工智能的相关知识有了更深入的理解。报告内容还进一步拓宽了学院研究生的视野,为未来关于多模态人工智能方向的学术研究和交流合作奠定了基础。

报告人简介:

Dongxu Li博士在澳大利亚国立大学 (ANU) 获得了计算机博士学位,主要研究方向是视觉和语言、多模态表征学习,研究工作包括BLIP系列,是多模态人工智能领域中具影响力的研究之一。