菜单
威利网络

威利数字档案馆新手:使用自动文本识别搜索和浏览七个世纪的手稿

新到狡猾的数字档案-搜索和浏览-七世纪-注释-带自动文本识别

克莱尔·奥尼尔, 威利图书馆服务

2021年5月12日

主要原始材料和数字档案继续从根本上改变传统研究,为研究人员提供了查看和扩展历史背景、文件和材料的机会。通过访问记录、案例研究、手稿、报告、图纸、地图、照片、期刊等图像,数字化档案对研究、学习和教学的价值再怎么强调也不为过。

通过恢复、数字化和编目世界上一些最具影响力的学术和科学学会及大学的档案,威利数字档案馆(WDA)用户可以在一个高级平台上访问独特的原始源内容,该平台旨在推动研究、支持教学和促进学习。

我们很高兴地宣布,威利数字档案馆(Wiley Digital Archives)通过自动文本识别(Automated Text Recognition,ATR)继续领导主要的源代码发现和分析技术,这是一种致力于手稿搜索和探索的人工智能,提供对记录七个世纪科学史的手写页面的全数字访问。

自动文本识别(ATR)

ATR是一个AI驱动的图像识别程序,它分析手写文档,根据各种数据集运行图像以确定最佳匹配,然后尝试识别这些手写文档中的单词。ATR与光学字符识别(OCR)不同,后者是大多数数字档案馆藏的标准,因为OCR侧重于排版材料中的每个字母,但不能读取手写体。

ATR前后信息

资料来源:https://www.wileydigitalarchives.com/platform网站/

没有ATR,手稿页面只能通过顶级元数据找到。文本不可搜索,只能通过阅读进行分析,这可能是一个费时费力的过程。通过ATR的引入,手稿页面被转换为排版,所有文本都是可搜索的,可以通过文本分析工具进行翻译、引用和分析。

面向研究人员、图书馆员和教授的ATR

学生和研究人员通常有意或无意地喜欢印刷材料,因为它会根据相关性的工作方式挤占搜索结果列表的顶部(它是可搜索的,搜索词可能会多次出现)。ATR扩展了此搜索结果列表,支持对独特的手稿进行简单、高效和有意义的搜索、发现和分析,使人们能够专注于有见解的内容,而不是耗时的工作。

ATR还支持出版和机构目标,因为获得其他地方无法获得的、由ATR支持的独特的主要来源有助于使您机构的研究人员及其工作走在其领域的前沿。

这种新技术也为虚拟教学提供了动力;使用ATR无缝地将主要资源整合到数字教室中,使这项工作对学生来说更具吸引力、更容易理解、更直观。

将ATR纳入威利数字档案

ATR七重虚拟教学

威利数字档案馆项目中有数十万页手写文本,分布在每个档案馆。通过将ATR纳入WDA计划,我们的分析结果将有所不同。新的联系可以被发现,旧的范式或公认的智慧可以被挑战,新的发现不可避免。

ATR的实施意味着手稿和印刷材料的可发现性将接近平价。这种规模的ATR有可能改变手稿研究的性质,并向努力满足精读手稿所需的要求和技能的新研究人员开放这一领域。

ATR将免费应用于威利数字档案馆的所有内容,WDA将继续作为一次性购买提供给无限并发用户,无需支付托管费。

WDA将是唯一一个在所有存档产品中实施ATR的商业存档计划。

要了解有关威利数字档案的更多信息、请求演示或开始免费试用,请访问:https://www.wileydigitalarchives.com/contact-us网站/.

 

进入档案馆

注册以接收最新的库新闻和产品更新