2025年1月11日,在中国科学院大学中关村校区教学楼N513会议室,中国科学院大数据挖掘与知识管理重点实验室(以下简称“重点实验室”)和中国科学院虚拟经济与数据科学研究中心(以下简称“虚拟中心”)共同举办了大数据挖掘技术研讨会(以下简称“研讨会”)。实验室主任石勇教授担任本次会议主持,参加会议人员还包括实验室副主任李建平教授和田英杰研究员、龙文研究员、齐志泉副研究员、郭琨副研究员,以及虚拟中心、经济与管理学院在读研究生,本次会议特别邀请虚拟中心毕业生且在京高校任教的青年教师,作为本次会议的特别嘉宾做学术报告。
图1 石勇教授发言
下午14:00,田英杰研究员从研讨会的会议安排、嘉宾介绍、会议内容等多方面展开,做了全面和具体的介绍,宣布研讨会正式开始。李建平教授介绍了重点实验室的发展现状,展望了未来的发展方向和目标。
接下来,研讨会在虚拟中心齐志泉副研究员的介绍下,开启第一场专题报告。虚拟中心龙文研究员以《基于金融大数据的股价预测与投资者行为研究》为题,在方法研究上提出了一个基于多视角学习的多源异构数据混合模型,在股价预测和交易策略上均表现出优异的性能;还依据大量实证结果研究了社交媒体上沉默多数和发声少数群体的情绪对股票收益率的影响和机制,以及在信息有效性识别上的作用。对外经济贸易大学副教授于晓丹以《智慧医养的行为学研究》为题,探讨了我国人口老龄化背景与政策,并对智慧医养创新应用做了国内外情况对比 ,阐述智慧医养行为学研究范式和未来的研究方向。
图2 龙文研究员做专题报告
图3 于晓丹副教授做专题报告
第二场专题报告由虚拟中心郭琨副研究员主持。对外经济贸易大学副教授汪波以《Tackling Biased Complementary Label Learning with Large Margin》为题,提出了文章中涉及的有偏互补标签学习(BCLL)的概念,并指出互补逻辑间隔(CLM)是BCLL的一种有前景的方法,还提到了COVR作为一种适用于CLM损失的损失函数,在学习一致性和增加逻辑间隔方面的稳健性等内容。首都经济贸易大学副教授陈振松以《Multi-label Financial Statement Fraud Detection》为题,将多标签学习框架引入财务报表欺诈检测问题,提出了一个增强的LSTM-MLP(长短期记忆网络-多层感知机)模型,并采用Top-K多标签分类阈值策略来充分利用标签信息,显著提高了财务报表欺诈检测模型效果。北京理工大学预聘助理教授刘佳斌以《基于特征表达与标签去模糊的弱监督机器学习研究》为题,在引出问题的基础上,对比例标签学习、部分多标签学习技术进行探索,并具体阐释了实验过程。
图4 汪波副教授做专题报告
图5 陈振松副教授做专题报告
图6 刘佳斌做专题报告
第三场专题报告由虚拟中心田英杰研究员主持。北京工业大学副教授雷名龙以《时空Transformer网络在天气预测中的应用》为题,分别对时空Transformer天气预报模型和物理知识蒸馏天气预报模型进行介绍和分析。北京邮电大学讲师付赛际以《知识驱动的机器学习范式》为题,提出了一种有效增广类别级特权信息的策略,收集了两个来自真实世界的数据集,并由专业人士进行了类别级特权信息的标注等工作内容的研究。北京工业大学讲师权沛以《基于上下文的图注意力神经网络》为题,从图数据及其特点展开对图研究相关的基础知识的介绍,提出传统研究方法难以统一处理节点特征和网络结构的痛点等研究内容。
图7 雷名龙副教授做专题报告
图8 付赛际做专题报告
图9 权沛做专题报告
最后,主任石勇教授发表了总结性发言,他高度评价了此次研讨会青年教师现有的工作内容和成绩,也针对不同的工作方向,提出了具体的工作建议,并对本次参会的所有师生表示感谢。在大家的共同交流和学习过程中,本次研讨会作为一次学术交流平台,取得圆满结束。
图10 参会人员合影