资源类型:
收录情况:
◇ 统计源期刊
◇ 北大核心
◇ CSCD-E
文章类型:
机构:
[1]广东省新黄埔中医药联合创新研究院健康检测技术装备研究中心
[2]广州中医药大学第二附属医院
广东省中医院
[3]季华实验室
出处:
ISSN:
关键词:
细粒度图像分类
注意力机制
互斥正则
深度学习
摘要:
细粒度图像分类(FGVC)具有类间差异小、类内差异大等特点,提升该任务效果的关键在于识别目标的判别性部位。目前基于注意力机制的方法一般会识别一个或者两个判别性部位,效果不佳。为此,提出一种注意力互斥正则机制的细粒度模型(AMEM),通过限制注意力图的不同通道关注不同目标部位,引导模型关注目标的多个判别性部位。在CUB-200-2011、FGVC-Aircraft、Stanford Cars和Stanford Dogs等4个公开数据集上进行评测,实验表明AMEM取得了90.5%、94.3%、95.5%和93.2%的准确率,效果优于对比实验中的其他细粒度模型;此外热力图显示可以识别出指定数目的判别性部位。AMEM在提升预测性能的同时,也能提供一定程度的预测可解释性。
基金:
广东省重点领域研发计划项目(2020B1111120004); 广东省科技计划项目(X190311UZ190);
第一作者:
第一作者机构:
[1]广东省新黄埔中医药联合创新研究院健康检测技术装备研究中心
通讯作者:
推荐引用方式(GB/T 7714):
陆靖桥,宾炜,卢永锵,等.结合注意力互斥正则的细粒度图像分类[J].计算机应用.2023,43(z1):224-228.