基于色彩距离最小化和最大色彩差的文本定位
DOI:
CSTR:
作者:
作者单位:

(1.湖南工程学院,工程训练中心,湖南 湘潭 411101; 2.湖南工程学院 计算机与通信学 院,湖南 湘潭 411101; 3.湖南工程学院 电气信息学院 湖南 湘潭 411101; 4.应用技术 学院,湖南 湘潭 411101)

作者简介:

刘美华(1980-),女,湖南新化人,硕士,讲 师,主要从事图像处理方面的研究.

通讯作者:

中图分类号:

基金项目:

湖南省教育厅科研(15C0330)和湖南省科技计划(2014FJ3054)资助项目 , 屈喜龙2, 周细凤3, 梁开健4 (1.湖南工程学院,工程训练中心,湖南 湘潭 411101; 2.湖南工程学院 计算机与通信学院,湖南 湘潭 411101; 3.湖南工程学院 电气信息学院 湖南 湘潭 411101; 4.应用技术 学院,湖南 湘潭 411101)


Text localization based on color distance minimization and maximum color differe nce
Author:
Affiliation:

(1.Engineering Training Center,Hunan Institute of Engineering,Xiangtan 411101,Ch ina; 2.College of Computer and Communication,Hunan Institute of Engineering,Xian gtan 411101,China; 3.College of Electrical & Information Engineering,Hunan Insti tute of Engineering,Xiangtan 411101,China; 4.College of Applied Technology,Huna n Institute of Engineering,Xiangtan 411101,China)

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    提出了一种基于色彩距离最小化和最大 色彩差(MCD)的场景文本定位方法。首先,使用多次K均值 聚类和色彩距离最小化的方法,从不同复杂程度的场景图像中提取文本 连通区域;考虑到色彩聚类方法容易受光照影响,使用基于MCD最大色彩差的方法,提取 文本连通区域作为补充,由于将 色彩与梯度信息相结合,在一定程度上能克服光照的影响;将得到的连通区域通过设 定的字符合并规则,构建文本行; 候选文本行中通常包含错误检测的非文本行,为了提高文本检测的正确率,最后采用基于特 征提取和机器学习的方法,验证 候选文本行,得到文本定位结果。将本文方法在ICDAR2011和ICDAR2013公共数 据库上实验,对于ICDAR2011数据集,本文 获得的召回率、准确率和F指标分别为0.66、0.77;对于ICDAR2013数据集,本文获得的召回率、准确率和F 指标分别为0.65、0.77。将本文方法与 其它文本检测算法比较,结果表明本文方法的可行性、有效性。

    Abstract:

    This paper proposes a scene text detec tion method based on color distance minimi zation and maximum color difference (MCD).Firstly,multip le of K-means clustering and color distance minimization are performed ,which can extract text connected components from images with different complexities.Considering color clustering method is usuall y influenced by luminance,we use maximum color distance to extract text connect components as supplements,which combines color with gradient information and can overcome the luminance influence to some extent.Then,the obtained connected components are grouped to form text lines following some character merging rules.The candidate text lines usually contain some falsely detected no n-text ones.To improve text detection accuracy, feature extraction and machine learning algorithms are finally used to identify the obtained candidate text lines,and we can get text localization results at last.The proposed method is evaluated on some publicly available datasets,including the ICDAR2011and ICDAR2013datasets.For the ICDAR2011dataset,the achieved recall,precision an d f-measure are 0.66,0.77and 0.71,respectively, and those on the ICDAR2013dataset are 0.65,0.77and 0.70,respectively.The co mparative results with some other text detection methods verify the feasibility and effectiveness of our method.

    参考文献
    相似文献
    引证文献
引用本文

刘美华,屈喜龙,周细凤,梁开健.基于色彩距离最小化和最大色彩差的文本定位[J].光电子激光,2015,26(10):2008~2015

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2015-04-17
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2015-10-29
  • 出版日期:
文章二维码