×

OLALA公司

swMATH ID: 38125
软件作者: 沈泽江、赵健、梅丽莎·戴尔、俞耀良、李维宁
描述: OLALA:用于高效文档布局注释的对象级主动学习。文档图像通常具有复杂的布局结构,每页上密集地排列着许多内容区域(如文本、图形、表格)。这使得布局数据集的手动注释既昂贵又低效。这些特点也对现有的主动学习方法提出了挑战,因为图像级别的评分和选择会受到常见物体过度曝光的影响。受半监督学习和自训练最新进展的启发,我们提出了一个用于高效文档布局注释的对象级主动学习框架OLALA。在此框架中,仅选择图像中对象预测最模糊的区域供注释器标记,从而优化注释预算的使用。对于未选定的预测,提出了半自动校正算法,以根据布局结构的先验知识识别某些错误,并在少量监督下进行校正。此外,我们仔细设计了一个基于扰动的文档图像对象评分函数。它通过评估预测模糊度来控制对象选择过程,并考虑预测布局对象的位置和类别。大量实验表明,在相同的标注预算下,OLALA可以显著提高模型性能和注释效率。可以通过此访问本文的代码https://github.com/lolipopshock/detectoron2_al(https://github.com/loliopshock/detetron2_al)
主页: https://arxiv.org/abs/2010.01762
源代码:  https://github.com/lolipopshock/detectoron2_al(https://github.com/loliopshock/detetron2_al)
关键词: 机器学习;arXiv_cs。LG公司;计算机视觉;模式识别;arXiv_cs。个人简历;arXiv_状态ML
相关软件: ImageNet公司;布局LM;TableBank(表格银行);PyTorch公司;布局分析器;dh段;级联TabNet;探测器;MS-COCO公司;Tesseract公司;AllenNLP公司;TensorFlow公司
引用于: 0个文档