软件学院刘晗副教授所在科研团队在数据挖掘、信息检索领域取得突破成果

2022年05月20日  点击:[]

近日,大连理工大学软件学院刘晗副教授所在科研团队在数据挖掘、信息检索领域取得突破性成果。多篇论文被国际顶级会议录用,录用的论文围绕小样本、零样本学习展开,重点解决情感分析、对话系统应用中存在的难题。相关成果分别发表于数据挖掘领域CCF A类会议KDD 2022,信息检索领域CCF A类会议SIGIR 2022。

成果一:Label-enhanced Prototypical Network with Contrastive Learning for Multi-label Few-shot Aspect Category Detection(KDD 2022)

该成果由刘晗副教授、张枫(2021级研究生,北京大学)、张晓彤副研究员、赵思洋(2021级研究生,大连理工大学)、孙俊杰(2021级研究生,大连理工大学),于红副教授,张宪超教授共同完成。方面类别识别是情感分析中的一个基本任务,旨在识别用户评论中的方面类别。由于用户经常从不同方面进行评论,因此多标签方面类别识别更具有应用价值。然而,目前的多标签方面类别识别方法依赖大量的标注数据进行训练,耗费人力物力。针对以上问题,文章基于小样本学习,提出了融合对比学习的标签增强原型网络。首先,利用标签类别信息产生更具判别性的原型,这解决了普通原型网络对多标签语句可能产生相同原型的问题。此外,文章在多标签的场景下融合了对比学习,促进模型学习更好的文本表示。文章也采用了一种简单有效的方式进行适应性的标签数量预测。

成果二:A Simple Meta-learning Paradigm for Zero-shot Intent Classification with Mixture Attention Mechanism(SIGIR 2022)

该成果由刘晗副教授、赵思洋(2021级研究生,大连理工大学)、张晓彤副研究员、张枫(2021级研究生,北京大学)、孙俊杰(2021级研究生,大连理工大学),于红副教授,张宪超教授共同完成。意图识别是对话系统中至关重要的环节,它的准确性将直接影响后续模块的效果。传统意图识别算法依赖于大规模、高质量的标注数据。然而,随着任务场景愈加广泛,用户意图愈渐多样,零样本意图识别任务应运而生。文章首先引入一种新的混合注意力机制编码单词出现模式,优化语句特征表征。然后提出了一种简单有效的零样本意图识别元学习范式,从而大幅提升了模型的泛化能力。

ACM SIGKDD Conference on Knowledge Discovery and Data Mining(简称KDD)是数据挖掘领域最权威的顶级国际学术会议,是中国计算机学会(CCF)推荐的A类学术会议。

ACM SIGIR Conference on Research and Development in Information Retrieval(简称SIGIR)是信息检索领域最权威的顶级国际学术会议,是中国计算机学会(CCF)推荐的A类学术会议。

团队相关教师信息:

刘晗副教授:http://faculty.dlut.edu.cn/liuhan/zh_CN/index.htm。

张晓彤副研究员:http://faculty.dlut.edu.cn/zhangxiaotong/zh_CN/index.htm。

于红副教授:http://faculty.dlut.edu.cn/2003011105/zh_CN/index.htm。

张宪超教授:http://faculty.dlut.edu.cn/zhangxianchao/zh_CN/index.htm。

上一条:【喜报】我院荣获2022年辽宁省普通高等教育(本科)教学成果一等奖 下一条:软件学院召开全体教职工大会

关闭