显著区域抑制与多尺度特征融合的建筑风格识别
CSTR:
作者:
作者单位:

(西安建筑科技大学 信息与控制工程学院,陕西 西安 710055)

作者简介:

孟月波 (1979-),女,博士,教授,硕士生导师,主要从事计算机视觉理解、建筑环境智能感知与调控、建筑智能化技术方面的研究 。

通讯作者:

中图分类号:

TP183

基金项目:

国家自然科学基金面上项目(52278125)和陕西省重点研究计划项目(2021SF-429)资助项目


Salient region suppression and multi-scale feature fusion for architectural style recognition
Author:
Affiliation:

(College of Information and Control Engineering, Xi′an University of Architecture and Technology, Xi′an, Shaanxi 710055, China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对建筑元素特征提取不全、相似建筑风格识别困难等问题,提出一种显著区域抑制与多尺度特征融合(salient region suppression and multi-scale feature fusion,SRSMSFF)的建筑风格识别方法。首先,采用改进的Resnet18提取初始建筑特征。然后,设计显著区域抑制模块(salient region suppression module,SRSM),通过隐藏最具判别性区域,引导网络学习潜在区域的特征,并设计多尺度特征融合网络(multi-scale feature fusion,MSFF),将多尺度结构与显著区域抑制相结合,以获取更完整的建筑元素特征。接着,利用通道注意力赋予各通道相应的权重,以突出重要的通道信息。最后,大边距度量损失函数(large-margin Softmax loss function,L-Softmax) 通过最大化特征嵌入空间的决策边界,改善相似建筑风格的识别。在公共建筑数据集10类、25类及自建中国古建筑数据集上的实验结果表明,本文方法的准确率分别达到80.21%、64.4%和88.21%,其性能优于目前的先进方法。

    Abstract:

    To address the problems of incomplete feature extraction of architectural elements and difficulties in the recognition of similar architectural styles,we propose a salient region suppression and multi-scale feature fusion (SRSMSFF) architectural style recognition method.First,the improved Resnet18 is used to extract the initial architectural features.Next,the salient region suppression module (SRSM) is designed,which guides the network to learn the features of potential regions by hiding the most discriminative regions.And multi-scale feature fusion (MSFF) is designed,which combines multi-scale structure with salient region suppression to obtain a more complete feature of architectural elements.Then,channel attention is used to assign corresponding weights to each channel, which can highlight important channel information.Finally,the large-margin Softmax loss function (L-Softmax) is introduced through maximizing the decision boundary distance of the feature embedding space,which improves the performance of similar architectural style recognition. The experimental results show that our model achieves 64.44% and 80.21% accuracy on the 25-class and 10-class public architectural style datasets.It achieves an accuracy of 88.21% on the dataset of ancient Chinese architectural styles.Its performance is superior to current advanced method.

    参考文献
    相似文献
    引证文献
引用本文

孟月波,刘佳,赵敏华,刘光辉.显著区域抑制与多尺度特征融合的建筑风格识别[J].光电子激光,2024,35(9):916~924

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-02-08
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2024-08-19
  • 出版日期:
文章二维码