学术大数据是科技管理与决策、领域专家发现、学术人才管理、创新科技服务等重要应用的关键基础,正在成为数据科学、网络科学、管理科学、计算社会科学等领域新兴的研究热点。本研究团队(The Alpha Lab)紧密围绕这一前沿主题开展研究工作,力图构建一套学术大数据分析挖掘技术和方法体系,并研发智能服务平台。相关工作获WWW 2017 Best Demo Award、IEEE DataCom 2017 Best Paper Award、IEEE UIC 2013 Best Paper Award等学术奖项,一项研究工作被Nature Index、科学网、中国科讯等国内外科技媒体重点报道。代表性研究成果如下:
(1)学术关系
建立了基于图学习的师生关系挖掘模型,生成了大规模学术族谱数据;设计了基于异构网络的隐式关系识别框架;提出了基于新型合作强度量化指标的学术团队识别方法。依托Liebig桶理论,构建了普适的学术团队量化分析模型,发现了学术团队中存在的“长板效应”。提出了高阶motif聚类、motif并行查找及异常motif识别等高效算法,建立了大网络理论方法框架。
(2)合作行为
基于多学科多领域的海量学术合作关系,融合时变网络分析、网络表示学习等理论方法,对合作价值、合作演化规律以及合作持续性进行建模与分析。提出了基于学术年龄的学术合作模式动态演化分析方法,发现了“物以类聚、人以龄分”的合作现象。利用多维学者画像模型设计了学者相似性精准度量方法,提出了基于动态属性网络表征的学术合作网络消失链路预测算法。
(3)学术画像
对论文、学者、机构的学术影响力进行了量化研究。提出了基于学术关系网络进行论文影响力分析的思路,利用加权引用构建了学术论文影响力排序算法。提出了“学者潜力”和“学者吸引力”的概念,建立了基于结构洞和信息熵理论的学者影响力评估方法。提出了一种基于隐式多特征学习的机构影响力预测模型,设计了基于关键词查询对高影响力主题进行发现的方法和系统。
(4)学术推荐
建立了一系列在不同应用场景和数据条件下对论文、合作者进行个性化推荐的创新方法。给出了确定关联目标学者的有效方法,构建了基于图的学术论文排序算法;提出了基于社会感知的学术论文推荐策略。提出了“最有价值学术合作者”的概念;设计了基于会议闭包的可持续性合作者推荐算法;提出了基于网络重构的合作者推荐策略。研发了Web of Scholars学术服务平台。
相关代表性论文:
[1] Wei Wang, Jiaying Liu, Zhuo Yang, Xiangjie Kong, Feng Xia. SCORE: Sustainable Collaborator Recommendation Based on Conference Closure, IEEE Transactions on Computational Social Systems, 2019. DOI: 10.1109/TCSS.2019.2898198
[2] Shuo Yu, Feng Xia, Huan Liu. Academic Team Formulation Based on Liebig's Barrel: Discovery of Anti Cask Effect, IEEE Transactions on Computational Social Systems, 2019. DOI: 10.1109/TCSS.2019.2913460
[3] Feng Xia, Wei Wang, Teshome Megersa Bekele, Huan Liu. Big Scholarly Data: A Survey, IEEE Transactions on Big Data, 2017, 3(1): 18 - 35.
[4] Feng Xia, Haifeng Liu, Ivan Lee, Longbing Cao. Scientific Article Recommendation: Exploiting Common Author Relations and Historical Preferences, IEEE Transactions on Big Data, 2016, 2(2): 101 - 112.
[5] Feng Xia, Zhen Chen, Wei Wang, Jing Li, Laurence T. Yang. MVCWalker: Random Walk Based Most Valuable Collaborators Recommendation Exploiting Academic Factors, IEEE Transactions on Emerging Topics in Computing,2014, 2(3): 364-375.