论文检索
期刊
全部知识仓储预印本开放期刊机构
高级检索

基于多尺度金字塔Transformer的人群计数方法OA北大核心CSTPCD

中文摘要

针对密集人群场景中背景复杂、目标尺度变化较大导致人群计数精度较低的问题,本文提出一种基于多尺度金字塔Transformer的人群计数方法(multi-scale pyramid transformer network,MSPT-Net)。在特征提取阶段设计了一种基于深度可分离自注意力的金字塔Transformer主干网络结构,该网络结构能有效捕获图像的局部和全局信息,从而有效解决人群密度图像背景复杂导致计数精度低的问题;设计了一种特征金字塔融合模块及多尺度感受野的回归头,实现了密集人群图像浅层细节特征和深层语义特征的高效融合,增强了网络对不同尺度目标的捕获能力;采用深度监督的训练方法在3个公开数据集上对提出的方法进行验证。实验结果表明,本文方法在全监督与弱监督学习策略中,与目前主流的人群计数方法相比,实现了更高精度的人群计数,克服了主流方法对背景复杂、目标尺度变化大的密集人群图像计数精度低的问题,同时本文方法保持着更小的参数量与计算量。

张少乐;雷涛;王营博;周强;薛明园;赵伟强;

陕西科技大学电气与控制工程学院,陕西西安710021陕西科技大学电子信息与人工智能学院,陕西西安710021 陕西科技大学陕西省人工智能联合实验室,陕西西安710021陕西科技大学电子信息与人工智能学院,陕西西安710021中电科西北集团有限公司西安分公司,陕西西安710065

计算机与自动化

密集人群;人群计数;多尺度;金字塔;Transformer;自注意力;密度图;深度监督

《智能系统学报》 2024 (001)

P.67-78 / 12

国家自然科学基金项目(62271296,62201334);陕西省重点研发计划项目(2021ZDLGY08-07);陕西省杰出青年科学基金项目(2021JC-47)。

10.11992/tis.202304044

评论

下载量:0
点击量:0