×

报纸缩微胶片图像的自动索引。 (英语) Zbl 1021.68717号

Lopresti,Daniel(编辑)等人,《文件分析系统V.第五届国际研讨会》,DAS 2002,美国新泽西州普林斯顿,2002年8月19-21日。诉讼程序。柏林:斯普林格。莱克特。注释计算。科学。2423, 365-375 (2002).
摘要:本文描述了一个旨在对旧报纸缩微胶片的数字化图像进行自动索引的文档分析系统。这是通过从缩微胶片图像中提取新闻标题来实现的。然后,OCR将标题转换为机器可读文本,作为相应新闻文章的索引。我们面临的一个主要挑战是缩微胶片的图像质量较差,因为大多数图像通常照明不足,而且相当脏。为了解决这个问题,我们提出了一种新的有效的字符与噪声背景分离方法,因为传统的阈值选择技术不足以处理这类图像。然后将游程长度涂抹算法(RLSA)应用于标题提取。实验结果验证了该方法的有效性。
关于整个系列,请参见[Zbl 1010.68812号].

MSC公司:

68单位99 计算方法和应用
68吨10 模式识别、语音识别
68第20页 信息存储和数据检索
PDF格式BibTeX公司 XML格式引用
全文: 链接