EN

我院几何计算与智能媒体技术研究所取得系列新成果

2024-03-07  点击:[]

针对人工智能领域中多任务耦合学习这一基本问题,我院团队取得重要进展,两项成果分别被计算机视觉和人工智能领域顶级国际期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)和计算机视觉和模式识别领域的顶级会议IEEE Conference on Computer Vision and Pattern Recognition (CVPR)录用。

理论方法成果“Learning with Constraint Learning: New Perspective, Solution Strategy and Various Applications ”由刘日升教授、高嘉馨博士研究生、刘轩硕士和樊鑫教授共同合作完成,被TPAMI录用。人工智能领域中的生成对抗网络及其变体、元学习,以及超参数优化等复杂多任务耦合学习问题,缺乏一个能够揭示多任务共性约束并进行高效训练的统一框架,从而造成学习过程不可控、结果不可靠。该研究提出了称为约束学习(LwCL)的全新学习框架,将学习子任务建模为不同层次的优化问题,从而多任务学习训练成为针对耦合总体目标的优化求解,进而能够得到具有收敛保证的可靠优化(学习)算法。在三类问题、共计九种不同类型的任务的大量实验证明了该框架的有效性与通用性。

该框架在脑影像分割中的应用成果“Bi-level Learning of Task-Specific Decoders for Joint Registration and One-Shot Segmentation”由樊鑫教授、硕士研究生汪小琳、博士研究生高嘉馨、王佳、罗钟铉教授和刘日升教授共同合作完成,被CVPR 2024接收。研究者们常利用空间图像配准来解决单样本医学图像分割,然而这些方法忽略了分割和配准任务特定之间的内在约束,导致训练不稳定效率低下。团队基于LwCL框架,提出了基于双层优化的合作学习训练算法,建模分割与配准任务解码器间的耦合依赖关系。该算法在预训练共享编码器基础上能够高效适应全新数据集,在仅有单个标注情况下,在多个数据集上实现了最好的分割性能,且对于不同的标注不敏感。

TPAMI是人工智能、模式识别、计算机视觉等领域的国际顶尖期刊,2023年度最新发布影响因子为23.6,是目前影响因子最高的CCF A类期刊。该期刊谷歌指数(H-Index)在计算机科学和工程技术两个大类学科里均列首位。CVPR是计算机视觉领域最顶级会议。根据谷歌2022学术影响力榜单:CVPR排名总榜第四,H5-index为422,仅次于Nature、NEJM和Science,在计算机学科所有期刊/会议中排名第1。

团队介绍:大连理工大学几何计算与智能媒体技术研究团队与立命馆大学合作建立健康医疗智能计算联合研究中心,研究课题包括机器学习、深度学习、计算机视觉、多媒体技术、优化方法等当前最前沿的领域,及其在医疗和健康领域中的应用。近年来在IEEE TPAMI、NeurIPS、ICML、CVPR、ICCV、AAAI、IJCAI等人工智能、多媒体技术等多领域的重要期刊及会议上发表论文达100余篇。该团队也一直致力于面向国家重大需求,加强关键共性技术研究,已经在全天候车载多波段立体视觉感知单元,以及水下目标自主抓取机器人等应用研发方面取得突破。