天天看点

CNCC | 多媒体内容理解与生成:技术与应用对话

CNCC2024

论坛简介:

多媒体内容理解与生成:技术与应用对话

举办时间:10月24日13:30-17:30

地点:秋苑-教室区(西2)

注:如有变动,请以官网(https://ccf.org.cn/cncc2024)最终信息为准

随着移动互联网和人工智能技术的飞速发展,多媒体内容理解与生成正成为当前科技前沿的热点领域,技术的不断突破正在推动多媒体数据的智能处理和创新应用,为行业和研究带来了新的机遇和挑战。

在多媒体内容生成方面,生成式人工智能展示了强大的潜力,这一技术的跨学科应用已经取得了显著成果,而基于几何深度学习的黎曼流形生成进一步推动了生成模型在非欧式空间中的应用。此外,在多媒体内容理解方面,知识引导的连续学习方法为解决如何在学习新知识时避免对旧知识的灾难性遗忘提供了新思路,通用多模态学习的兴起为实现多模态数据的全面理解提供了新的可能性。

本论坛将围绕多媒体内容理解与生成的关键技术,深入探讨生成式人工智能的跨学科应用、几何深度学习在流形生成中的最新进展、激光雷达视觉全球定位技术,以及多模态学习在统一架构下的突破与挑战,旨在为多媒体内容生成与理解提供新的研究方向和应用场景,推动技术的持续发展与创新。

论坛日程

顺序 主题 主讲嘉宾 单位
1 论坛开幕致辞 高赞 山东省人工智能研究院
2 特邀嘉宾致辞 黄庆明 中国科学院大学
3 知识引导的连续学习方法 李宏亮 电子科技大学
4 激光雷达视觉全球定位 王程 厦门大学
5 通用多模态学习 俞俊 哈尔滨工业大学(深圳)
6 生成式人工智能及其多学科交叉融合应用 颜波 复旦大学
7 基于几何深度学习的黎曼流形生成 邹君妮 上海交通大学
Panel环节 黄铁军 北京大学
陶建华 清华大学
王勋 浙江工商大学
周杰 清华大学
张艳宁 西北工业大学
聂礼强 哈尔滨工业大学(深圳)

论坛主席及嘉宾介绍

论坛主席

CNCC | 多媒体内容理解与生成:技术与应用对话

高赞

山东省人工智能研究院/天津理工大学教授、副院长

CCF高级会员,国家青年人才计划人选、山东省突贡专家,“计算机视觉与系统”教育部重点实验室副主任,曾获山东省科技进步一等奖和山东省技术发明一等奖各1项。近年来,主持或参与包括国家自然基金重点和国家重点研发等省部级以上课题20余项。主要研究领域包括多媒体理解与分析等,在包括TPAMI和CVPR等国际会议和期刊发表论文100余篇,其中ESI高被引论文6篇、热点论文1篇。2021年获CCF A类会议SIGIR最佳学生论文,授权发明专利50余项。

特邀嘉宾

CNCC | 多媒体内容理解与生成:技术与应用对话

黄庆明

CCF会士、CCF理事、多媒体技术专业委员会主任,中国科学院大学教授

中国科学院大学讲席教授,国家杰出青年科学基金获得者,享受国务院政府特殊津贴。主要研究方向为多媒体计算、模式识别、机器学习等,主持承担了新一代人工智能国家科技重大专项、国家自然科学基金重点和重点国际合作项目、863课题、973课题等国家和省部级项目的研究工作,已在国内外权威期刊和国际会议发表论文600余篇。获吴文俊人工智能自然科学一等奖、CSIG自然科学一等奖、教育部科技进步一等奖等多项国家学会和省部级奖励。

论坛讲者

CNCC | 多媒体内容理解与生成:技术与应用对话

李宏亮

电子科技大学教授

国家杰出青年科学基金获得者,主要研究领域包括多媒体理解与分析,视觉感知模型以及机器学习等,已发表IEEE汇刊论文70余篇。主持了科技部科技创新2030新一代人工智能重大项目、国家自然科学基金重点以及联合基金重点项目等。担任《电子学报》、IEEE TCSVT(2018-2021)、JVCI以及SPIC期刊编委;曾担任IEEE ISPACS 2010大会主席,IEEE VCIP 2016以及PCM 2017技术委员会主席等。获JVCI杰出服务奖,IEEE TCSVT最佳编委奖,CCF以及IEEE CAS杰出讲者。

报告题目:知识引导的连续学习方法

报告摘要:如何学习新知识的同时减少对旧知识的灾难性遗忘是目前连续学习面临的重要挑战。本次报告将围绕视觉任务中的连续学习问题,从多教师连续学习机制,到具体视觉任务中的连续学习模型的实现,介绍最近的相关工作。最后针对视觉任务连续学习的若干问题进行简要讨论。

CNCC | 多媒体内容理解与生成:技术与应用对话

王程

厦门大学教授

CCF杰出会员,国家级人才计划基金获得者,入选国家“万人计划”科技创新领军人才,IET会士。现任福建省智慧城市感知与计算重点实验室主任。研究兴趣包括计算机三维视觉,激光雷达数据处理,遥感智能处理,空间大数据分析,智慧城市。在Nature Communication,IEEE TGRS,CVPR等顶级期刊和会议发表300余篇论文,被引用超过10000次。担任ISPRS多传感器集成与融合工作组主席,CCF YOCSEF厦门分论坛(创始)主席,CSIG常务理事。获得省部级科技进步一等奖等奖励5项。

报告题目:激光雷达视觉全球定位

报告摘要:全球定位在数字经济中占核心地位,但城市复杂环境限制了卫星定位应用。三维激光扫描技术凭借精确的三维感知能力,正成为城市定位的新曙光。报告将介绍厦门大学ASC实验室在激光雷达视觉全球定位方面研究进展。首先,解释基于隐式表达的激光雷达视觉定位基本原理。接着,介绍从深度回归到几何编码的高效定位方法,并展示国际首个达到亚米级定位精度的大范围激光雷达全球定位成果。最后,总结并展望未来发展趋势。

CNCC | 多媒体内容理解与生成:技术与应用对话

俞俊

哈尔滨工业大学(深圳)教授

国家杰出青年基金获得者。主要研究方向为跨媒体分析技术,发表IEEE/ACM汇刊及CCF A类论文百余篇,Google Scholar引用次数10000余次,10余篇论文入选ESI高被引/热点论文。近年来主持科技部重点研发计划、国家自然科学基金重点项目、国家自然科学基金面上项目等,2015、2016、2017连续获得IEEE TMM、TIP、TCYB最佳论文奖,2018年教育部自然科学二等奖,2021年浙江省自然科学一等奖。担任多个国际期刊的副编辑。

报告题目:通用多模态学习

报告摘要:得益于深度自注意力网络模型Transformer和预训练方法BERT在自然语言领域的快速发展,多模态深度学习的研究逐渐由各个任务“分而治之”向“通用统一”的方向演变。本报告首先对多模态深度学习发展过程中的代表性工作进行简要介绍;然后对当前通用多模态深度学习领域的三类代表性方法:基于多模态多任务联合学习、多模态神经架构搜索、多模态预训练的若干代表性工作进行详细介绍;最后,对通用多模态深度学习未来的发展进行展望和反思。

CNCC | 多媒体内容理解与生成:技术与应用对话

颜波

复旦大学教授

教育部长江学者,复旦大学发展规划处副处长、计算机科学技术学院学术委员会副主任、上海市图像图形学学会副理事长。研究领域包括计算机视觉、智慧医疗和科学智能等。以第一/通讯作者在Nature Methods等国际期刊和会议发表论文70余篇。获国家联合重点和华为基金等多项省部级和企业合作项目资助。项目相关成果在华为旗舰手机、公安系统和三甲医院得到了较好应用。曾获2020年教育部自然科学二等奖、2019年CSIG科学技术二等奖等。

报告题目:生成式人工智能及其多学科交叉融合应用

报告摘要:随着大模型技术的持续突破,生成式人工智能展现了强大的生成能力。本报告将主要介绍团队在生成式人工智能方向上的持续探索成果,并在智能终端和智慧安防等多场景下所取得的若干研究成果;同时和物质科学深度融合,辅助合成新材料,为生成式AI提供新数据,从而实现人机协同研究,加速科研裂变;最后将相关成果应用于智慧医疗场景,为各科室的智能诊疗提供强力支撑。

CNCC | 多媒体内容理解与生成:技术与应用对话

邹君妮

上海交通大学教授

国家杰出青年科学基金获得者。先后获得上海市科技奖励一等奖4项,中国电子学会科技奖励二等奖3项,吴文俊人工智能科技奖励二等奖1项。主要研究领域:多媒体通信、高维视觉信息处理、几何深度学习等。主持国家自然科学基金重点等项目8项,共发表SCI、EI收录论文150余篇,其中IEEE汇刊论文50余篇,NeurIPS、ICML等国际学术会议论文45篇;合作出版专著2部,获中美授权发明专利50项。曾担任国际期刊Digital Signal Processing编委。

报告题目:基于几何深度学习的黎曼流形生成

报告摘要:近些年,扩散模型在生成式建模任务中取得了巨大成功。在基于二维图像的扩散模型启发下,许多研究开始关注高维流形结构的扩散模型。流形信号位于非欧式空间,为了实现精准生成与重建,需要同时考虑原始数据的概率分布以及流形信号的几何特征与拓扑结构。本报告将从几何学和深度学习的角度,介绍流形信号生成的最新进展,并进一步探讨在扩散模型中引入Ricci曲率流,学习流形信号内蕴几何特征的可能性。

嘉宾

CNCC | 多媒体内容理解与生成:技术与应用对话

黄铁军

CCF会士、北京大学教授

北京大学计算机学院教授,北京智源人工智能研究院院长,北京大学人工智能研究院副院长,国家杰出青年科学基金获得者。从事智能视觉信息处理技术研究30多年,发表学术论文300多篇,专著2部,授权发明专利100多项。全程参与大陆新一代人工智能发展规划建议、起草和实施,担任科技创新2030新一代人工智能重大科技项目专家组副组长,国家人工智能标准化总体组副组长,新一代人工智能产业技术创新战略联盟秘书长等。

CNCC | 多媒体内容理解与生成:技术与应用对话

陶建华

CCF会士、清华大学教授

模式识别国家重点实验室副主任,国家杰出青年科学基金获得者。主要研究包括:语音合成与识别、语音编码、人机交互、多媒体信息处理和模式识别。负责国家863、自然科学基金、国家重点研发计划等项目20余项,在国内外学术期刊和会议上发表论文240余篇,其中SCI或EI检索110余篇,已授权国内发明专利15项,国际专利1项,并多次在国内外重要学术会议上获奖。多次担任863和国家自然科学基金等国家项目会评专家。

CNCC | 多媒体内容理解与生成:技术与应用对话

王勋

浙江工商大学教授、计算机学院院长

浙江工商大学教授、计算机学院院长。浙江省大数据与未来电子商务技术重点实验室主任、可视媒体大数据技术浙江省工程中心主任。入选“国家百千万人才工程”、获国务院政府特殊津贴,首批浙江省高效黄大年式教师团队负责人。近几年主要在移动图形计算、计算机视觉等领域开展研究,在国内外重要期刊与国际会议上发表高水平学术论文150余篇。主持省部以上重大重点项目20余项;第一完成人获省部级一、二等奖6项、国家教学成果二等奖1项。

CNCC | 多媒体内容理解与生成:技术与应用对话

周杰

清华大学教授

清华大学自动化系教授,全国重点实验室主任,国家杰出青年科学基金获得者,国家基金委创新研究群体学术带头人,IAPR Fellow。长期从事模式识别与计算机视觉研究,发表IEEE期刊论文100多篇,其中IEEE TPAMI长文34篇。以第一完成人获国家技术发明二等奖、中国专利银奖、中国电子学会一等奖等奖励,指导博士生获得全国优秀博士论文提名奖、中国人工智能学会优秀博士论文(4人次)、中国图像图形学会优秀博士论文。现担任IEEE TPAMI编委、PR副主编等。

CNCC | 多媒体内容理解与生成:技术与应用对话

张艳宁

CCF会士、CCF常务理事、西北工业大学教授

西北工业大学教授,党委常委,副校长,国家级人才,国防973项目首席。长期致力于图像处理、模式识别、计算机视觉与智能信息处理等的研究,并与航天、航空等方面的国家重大需求相结合。在IEEE TPAMI、IEEE TIP、CVPR、ICCV等国际期刊和会议发表论文百余篇,承担国家级项目40余项。研究成果被多个国家级重大工程攻关项目采用,成功应用于航天、航空、能源、水利等行业的20余家单位,获陕西省科技进步一等奖,国防技术发明一等奖。

CNCC | 多媒体内容理解与生成:技术与应用对话

聂礼强

哈尔滨工业大学(深圳)教授

哈尔滨工业大学(深圳)计算机学院二级教授、执行院长,IAPR Fellow,曾两次入选国家级人才计划。主持两项基金委重点项目、1*3基础加强项目、科技部重点研发课题、省杰青、两项千万级横向项目等。致力于多媒体内容分析与搜索的研究,发表CCF A类论文百余篇。任IEEE TKDE、ACM ToMM等汇刊编委,NeurIPS/AAAI/KDD/IJCAI等会议AC或SPC等。获达摩院青橙奖2020、山东省科技进步一等奖2021(序1)、山东省技术发明一等奖2023(序1)等奖励。

CNCC | 多媒体内容理解与生成:技术与应用对话

刘萌

山东建筑大学教授

论坛联合主席,山东建筑大学教授,山东省高等学校“智能媒体分析与检索”创新团队负责人。研究方向为多媒体内容分析、信息检索、跨媒体分析与推理等。主持国家重点项目子课题、面上基金、青年基金等多个项目。发表CCF A类会议、IEEE/ACM汇刊论文70余篇,出版英文专著1部。获CCF A类会议ACM SIGIR 2021最佳学生论文奖、ACM MM 2023挑战赛冠军、CVPR 2024挑战赛冠军、首届国际基础科学大会前沿科学奖、ACM SIGMM 2020优博奖等。

关于CNCC2024

CNCC2024将于10月24-26日在浙江省东阳市横店镇举办,大会主题为“发展新质生产力,计算引领未来”。大会为期三天,包括18个特邀报告、3个大会论坛、138个专题论坛及34场专题活动和100余个展览。图灵奖获得者、两院院士、国内外顶尖学者、知名企业家在内的超过800位讲者在会上展望前沿趋势,分享创新成果。预计参会者超过万人。

继续阅读