学院动态

    学院动态

    我院智能集群系统教育部工程中心最新研究成果被国际顶级会议AAAI 2025接收并入选Oral环节

    日期:2025-02-17 信息来源:李璐璐 浏览量:

    郑州大学计算机与人工智能学院硕士研究生陈伟、闫锦星、李慧岭,博士研究生高磊以及指导老师李亚飞教授、徐明亮教授合作完成的最新研究成果“Gradient-Guided Credit Assignment and Joint Optimization for Dependency-Aware Spatial Crowdsourcing”近日被人工智能领域顶级国际会议AAAI 2025录用,并入选Oral环节。

     

    AAAI (Association for the Advancement of Artificial Intelligence)conference是人工智能领域的顶级会议之一,每年举办一次。第39届AAAI将于2025年2月25日至3月4日在将在美国费城举办。本届会议共收到有效投稿12957篇,其中3032篇论文被录用,录用率为23.4%,600篇文章被选为oral presentation,总占比仅为4.6%。


    摘要

    本研究面向空铁联运协同调度、灾难救援应急响应、航空保障智能决策等重要应用场景需求,聚焦解决其中的核心科学问题“依赖感知空间众包的复杂任务分配协同机制”展开研究。针对复杂空间子任务间依赖约束引发的信用分配与策略协同难问题,创新性地提出双阶段优化架构——推荐匹配与协同优化(RMO)框架。该架构融合群体智能决策机制与多维效能评估模型,实现了依赖型任务的分布式推荐与全局化匹配的协同优化。具体而言,通过构建元梯度驱动的决策网络双重训练机制,在以下两方面取得突破:(1)设计多智能体协同学习策略,建立跨子任务的动态信用分配机制;(2)提出自适应参数同步算法,确保任务推荐网络与匹配效用函数的策略一致性。实验表明,该框架通过建立梯度传播通道与参数共享机制,显著提升模型收敛效率。形成的"需求感知-动态推荐-全局匹配"技术链,为构建群体智能新型决策理论提供了核心方法支撑。

    方法

    本文创新性地提出两阶段推荐-匹配协同优化(RMO)框架(如图1),通过任务图拓扑特征解析与资源适配的动态耦合机制,破解依赖感知型空间众包任务分配难题。该框架采用以下核心技术路径:

     图1  推荐与匹配优化框架(RMO)

    拓扑感知的子任务推荐:基于多智能体深度强化学习构建动态推荐网络,通过图神经网络(GNN)提取任务图的时空依赖特征,建立子任务贡献度量化评估模型。针对任务耦合性引发的信用分配困境,设计基于注意力机制的策略协同模块,实现跨子任务的边际效用精准计算,确保推荐策略同时满足全局任务完成度与平台收益最大化目标。

    约束驱动的动态匹配优化:提出元梯度增强型自适应匹配算法,将推荐子任务建模为二分图最优匹配问题(如图2)。采用改进型Kuhn-Munkres算法实现多约束条件下的最大权匹配;通过构建元梯度传播通道,利用超参数敏感性分析动态调整匹配效用函数的权重系数,使匹配策略与推荐网络形成策略一致性闭环。

    双阶段策略协同机制构建:通过元梯度反向传播构建端到端优化链路,在推荐阶段,元梯度指导多智能体信用分配矩阵的迭代更新,破解"贡献度-回报值"的映射难题;在匹配阶段,利用元学习同步优化KM算法的松弛变量与推荐网络的策略空间,形成双向策略反馈。这种"特征提取-策略推荐-参数同步"的闭环架构使系统决策效能得到较大提升。

    图2  利用元梯度构建辅助训练过程

    该框架的核心突破在于:通过元梯度桥梁作用,首次实现任务推荐策略与资源匹配机制的全流程联合优化,为复杂场景下多模态任务的协同分配提供了可解释、可扩展的解决方案。

    主要实验结果

    为了评估所提方法的有效性,进行了对比分析,选取了两种基线方法进行比较:(1) 仅使用稀疏奖励训练的策略;(2) 仅使用奖励重塑训练的策略。在实验中,保留了不同训练阶段的策略,并在相同的数据集上进行测试。实验以众包平台的平均收益作为衡量指标。实验结果如图3所示。

     

    图3  元梯度辅助训练对比实验

    图4展示了 RMO 框架的优越性能,尤其是在任务推荐方面,RMO 方法明显优于其他算法。值得强调的是,随着任务数量的增加,采用联合优化的方法相比于仅使用现有众包方法展现了更为明显的优势。

     

    图4  不同任务数量下各算法效能表现

    总结

    本文创新性地构建了双阶段推荐与匹配优化框架(RMO),有效解决了依赖关系感知的空间众包任务分配难题。核心贡献在于首创基于元梯度的联合优化机制,通过动态信用分配算法突破稀疏奖励环境下多智能体协同的瓶颈,结合超参数同步优化技术实现神经网络参数的智能调控。该框架采用独特的并行双阶段训练架构,通过端到端的梯度优化过程显著提升算法效率。研究成果为空铁联运智能规划、灾害应急响应系统、航空保障动态调度等复杂场景提供了可靠的技术支撑,在任务分配准确率和资源利用率等关键指标上展现出显著优势。

     

    主要作者介绍

    陈伟

    郑州大学计算机与人工智能学院2022级硕士研究生,主要研究方向为空间众包,强化学习和元学习。

    李亚飞

    郑州大学计算机与人工智能学院教授。主要研究领域包括群体智能、移动计算、大数据管理与分析、数字孪生等。主持包括国家自然科学基金面上/青年项目、中原英才计划-青年拔尖人才项目、河南省自然科学基金优秀青年基金/重点项目以及企业委托项目等多个国家/省部级及企业课题。在CCF A类国际期刊/会议和ACM/IEEE系列汇刊发表论文40余篇。

    徐明亮

    郑州大学计算机与人工智能学院教授。主要研究方向包括人工智能、大数据、机器人、工业软件以及重要领域关键装备系统与软件研制。主持国家自然科学基金杰出青年基金/优秀青年基金/重点基金、国家重大专项(国防)、国家重点研发计划等国家级项目10余项和一批企业委托重大横向项目,在CCF A类国际期刊/会议和ACM/IEEE系列汇刊发表论文100余篇。

     


    版权所有 © 郑州大学计算机与人工智能学院  All Rights Reserved.