基于注意力机制的多方向文本检测
DOI:
CSTR:
作者:
作者单位:

(1.西安工程大学 电子信息学院,陕西 西安 710048; 2.深圳罗博泰尔机器人技术有限公司,广东 深圳 518109)

作者简介:

徐 健 (1963-),男,教授,硕士生导师,主要从事图像处理、机器视觉方面的研究.

通讯作者:

中图分类号:

基金项目:

陕西省科技厅项目(2018GY-173)和西安市科技局项目(GXYD7.5)资助项目


Multi-directional text detection based on attention mechanism
Author:
Affiliation:

(1. School of Electronics and Information, Xi′an Polytechnic University, Xi′an, Shaanxi 710048, China;2. Municipal Robotel Robot Technology Co. , LTD,Shenzhen,Guangdong 518109,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对多方向排列的文本因其尺度变化大、复杂背景干扰而导致检测效果仍不甚理想的问题,本文提出了一种基于注意力机制的多方向文本检测方法。首先,考虑到自然场景下干扰信息多,构建文本特征提取网络(text feature information ResNet50,TF-ResNet) ,对图像中的文本特征信息进行提取;其次,在特征融合模型中加入文本注意模块(text attention module,TAM) ,抑制无关信息的同时突出显示文本信息,以增强文本特征之间的潜在联系;最后,采用渐进扩展模块,逐步融合扩展前部分得到的多个不同尺度的分割结果,以获得精确检测结果。本文方法在数据集CTW1500、ICDAR2015上进行实验验证和分析,其F值分别达到80.4%和83.0%,比次优方法分别提升了2.0%和2.4%,表明该方法在多方向文本检测上与其他方法相比具备一定的竞争力。

    Abstract:

    Aiming at the problem that the detection effect of multi- directional arrangement text is still not ideal due to its large scale change and complex background interference,this paper proposes a multi-directional text detection method based on attention mechanism. Firstly,considering that there is a lot of interference information in natural scenes,a text feature extraction network is constructed to extract the text feature information in the image;Secondly,a text attention module (TAM) is added to the feature fusion model to suppress irrelevant information while highlighting textual information to enhance potential connections between text features;Finally,a progressive expansion module is used to gradually fuse the segmentation results obtained from the pre-expansion part at several different scales to obtain accurate detection results.The method is experimentally validated and analysed on datasets CTW1500 and ICDAR2015,and its F-values reach 80.4% and 83.0% respectively,which are 2.0% and 2.4% better than the next best method, indicating that the method is competitive with other methods in multi-directional text detection.

    参考文献
    相似文献
    引证文献
引用本文

徐健,郭湛澎,刘秀平,陈博,闫焕营.基于注意力机制的多方向文本检测[J].光电子激光,2023,34(2):166~173

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-03-09
  • 最后修改日期:2022-04-29
  • 录用日期:
  • 在线发布日期: 2023-02-17
  • 出版日期:
文章二维码