数字空间中的手稿研究:现状 领域和新的前进道路
摘要
一、简介
二、。 问题和需求
概述
|
|
学者、馆长、图书馆员和技术人员的要求
学者要求:
一个工具/工作区,汇集了以前的学术评论 特定文本和作者的手稿; 利用编目员和 不同领域的内容专家(例如,手稿专家、, 考据学者、艺术历史学家)。 正如我们在 研讨会,“没有人能做到 单独”; 协作学术工作流(例如,功能和 在数字空间中实现学术研讨会模型的工作流 多个学者共同研究一份手稿)和类似的 公民科学、知识采购或众包的工作流 主动性; 用于学生和“公民”的教学工作流 科学家; 能够从多个数字访问手稿图像 存储库并在其上使用数字工具(即客户端 应用模型); 文本和图像数据的集成-如图所示 图3 ,超过65% 受访者表示,他们需要能够同时处理这两个问题 他们工作中的手稿文本和图像数据;
能够注释文本和图像数据。 注释的能力 72%的人将这两种类型的数据作为要求报告 受访者(请参阅 图4 );
关于如何设置和使用新的 数字工具和工作空间; 创建联合项目的体制机制和支持 与数字图书馆员和技术人员合作; 通用网关(因为有太多单独的数字 具有无法连接的存储库的手稿集合 普遍搜索),多个相似文本的链接 存储库,以及有关它们之间差异的信息 副本; 创建和发布数字学术期刊的工具和工作流 作品的版本(例如,数字评论版、多文本 版本),包括同行审查机制; 更好的非拉丁语脚本/从右向左的语言支持; 支持多媒体档案; 地理标记(例如,用于建筑图像) 使地点的历时变化可视化, 建筑物等。; 将录音与地理空间联系起来; 能够并肩工作,使用相同的多个版本 手稿-超过85%的调查报告的要求 被调查者( 图5 )-和能力 注释文本变体并比较和分类大型集合 将手稿分为手稿系列。
馆长和图书馆员的要求:
编目工作流(针对单独编目器和协作编目器 编目项目); 用户友好共享; 纳入保护报告; 更多关注书籍对象和结构的实质性 (例如,绑定),包括整个对象上的元数据; 允许受限用户访问的机制(尽管许多 收藏正在转向开放存取模式,并非所有的收藏都是 愿意让图像完全开放访问:在调查结果中 相当多的少数人(37%)仍然报告说,他们需要限制 由于许可/版权原因访问其图像或文本数据 -参见 图6 );
当地团队可以使用的工具(尤其是在贫困或冲突中 区域),计算量轻且符合标准(因此 帮助促进与更广泛的学术团体的合作); 处理单个多个手稿的标准 法典; 离散密码的数字统一; 从其所在国移走的物品的数字遣返 起源; 扩展了纸张类型、墨水颜色、, 皮革类型; 包含保存元数据; 更好地支持处理替代方案(即非传统方案 手稿)图像数据,如结婚证书、视听 材质、纺织品和3D对象。
技术人员要求:
互操作性; 符合标准; 手稿数据的永久标识符和永久引用-a 超过92%的调查对象表示,关键需求是 他们的工作所需的(参见 图 7 );
命名实体识别; 能够显示文档和已知元数据; 能够添加和更正现有元数据; 在线发布文本的稳定版本号(即。, 版本控制); 版本控制(即通过 时间); 通过标签或git提交散列引用; 支持多方向阅读; 工具/平台在低带宽位置的可用性; 拒绝数字存储库竖井模型; 内置的受控词汇表 编目/元数据; 能够以多种标准格式导出数据,尤其是TEI XML; 在线托管解决方案(首选)或可下载的现成解决方案 程序,因为大多数用户报告他们没有必要的 具备设置工具/平台的技术知识,他们不具备 技术专家为他们提供支持(参见 图2 ).
工具特定问题
它是什么用例和工作流 旨在 支持? 它还有哪些其他用例和工作流 能够 支持的? 能否通过将其与其他功能组合来填补功能上的空白 工具? 是否可以通过使用新的 发展? 要有效地使用它,需要什么技能? 需要什么技能才能用新的 功能? 它在多大程度上支持数据管理最佳实践?
|
|
|
|
|
|
|
|
||||||
|
||||||
|
||||||
|
||||||
|
||||||
|
|
|
|
|
|
|
|
|
||||||
|
||||||
|
||||||
|
||||||
|
||||||
|
三、 现场观察结果和建议
洞察力
需要解决的工作流程多种多样。 教学需要不同的工作流程, 编目、保存、个人学术, 协作学术和公民科学(众包) 工作。 因此,一些工具可能使用共享的基础平台 (例如,Omeka或Drupal)并添加不同的工作流 基本平台的模块或插件。 这种方法 更容易重用和重新调整现有的用途 平台。
该工具的代码基础和社区参与程度是 对可持续性和扩张至关重要。 代码库显著影响未来的可用性 工具。 例如,高质量的代码库减少了 招募新贡献者的总成本。 活跃的用户和开发人员社区对于 维持工具。 值得研究最佳实践 在这一点上。 遵循开发最佳实践,例如生产 全面的单元测试和开发人员文档 对重用至关重要。
没有面向学者和 研究手稿的学生。 没有端到端的解决方案 无显影剂。 该领域仍然缺乏基本的基础设施、指导和 针对个别学者和小型企业的可持续解决方案 管理和保存手稿图像的机构 和数据。
迭代是不可避免的。 没有一个工具或平台会成为 灵丹妙药,所以我们需要考虑迭代 发展与合作发展 现有工具和平台。
工具/平台创建是一种协作形式的智能 劳动力。 我们需要吸引学者、馆长和图书管理员 与技术专家一起创建新工具和 平台并致力于重新定义这种协作 作为一种智力劳动形式的工作 现有招聘中的大学管理, 晋升和任期审查流程。
建议
数据管理和工具创建应单独处理 项目。 我们需要独立于 它在特定工具中的表现形式。 例如,高 分辨率图像可以存储并保存在图像中 旨在促进协作的存储库工具 手稿工作可以使用IIIF表现 无需存储和保存原始图像 图像。 我们需要计划实现持久识别和 引文,以便有明确的联系 点并使用比工具更耐用的API。 数据必须易于导出和转换。
我们需要创建更多的“贸易区” [ Galison 1997年 ]技术专家、图书馆员、, 馆长和手稿学者。 我们需要建立社区和空间(即“贸易区”) 由技术专家、图书馆员和学者组成 发展促进合作的“中介语”。 在我们与用户的研讨会圆桌会议期间 例如,很明显,有多种类型的 用户想要但无法在中找到的功能 现有的解决方案,甚至没有考虑过 之前。 此类平台的开发人员将从中受益 通过了解贸易区的需求 目标用户群体,从而提高整体 平台的设计和功能。
我们需要更好地记录我们的工具的工作流和用例 都是为了地址。 需要确定工作流和理想用例,并 记录每个工具(在车间中变得清晰 即使是该领域的专家也不总是能够 轻松确定 旨在支持的特定工具)。 有良好文档记录的工作流 并且用例可以扩展和重新调整工具的用途 更容易的。
避免从头开始。 由于没有满足广泛范围的平台 对于需求和工作流程,可能会考虑 从头开始构建平台。 我们认为最好是 抵制这种诱惑。 存在许多平台(例如。, Omeka和Drupal),可作为基础基础设施 用于开发工具。 设计师和开发人员可以使用 并添加模块和插件来扩展其 服务于特定工作流和使用的功能 案例。
附录一:调查信息
问题1-如果你目前正在研究手稿,你是否使用任何数字工具 还是平台? 问题2-如果你目前正在学习手稿,但没有使用任何数字 工具或平台,为什么不使用任何现有工具和 平台? 问题3-如果你目前在学习手稿时确实使用了平台或工具, 你用哪一种? 问题4-你为什么使用问题中提到的平台 以上? 问题5-您认为哪些工具或平台是该领域中最好的 目前? 问题6-这些工具或平台的哪些特性和功能最重要 对你来说很重要吗? 问题7-这些工具和平台的哪些特性和功能将 你希望看到改进,以及如何改进? 问题8-你希望在手稿中看到什么特性或功能 您当前在任何现有工具中都看不到的工作区 平台? 问题9-手稿集的大致大小是多少 你通常以学者或馆长的身份与之合作? 小于100 大于100但小于500 大于500但小于1000 大于1000,但小于5000 5000多
问题10-以下哪些选项是您的主要关注点 数字化工作? 手稿图像 文本本身 两者都有
问题11-您需要支持注释吗? 图像注释 文本注释 两者都有
问题12-你在处理同一文本的多个手稿吗? 问题13-是否允许引用您的手稿数据(文本或图像) 对你来说很重要吗? 问题14-您是否需要限制对以下内容的图像或文本内容的访问 许可/版权原因? 问题15-是否有特定的文件格式(例如TEI XML) 用于存储您的研究成果? 请提供文件 格式。 Q17-您在母校是否有技术人员或服务 可以为您安装和运行这些工具,或者您更喜欢使用 您的机构不必维护的在线网站? 我更喜欢我的家庭机构安装和运行工具 我喜欢使用我所在机构没有的在线网站 保持
阿拉伯文学学者(阿拉伯文学学者_at_utlists_dot_utexas_dot_edu) Adabiyat(Adabiyat_at_lists_dot_uchicago_dot_edu) 伊斯兰AAR(islamar_at_lists_dot_psu_dot_edu) 数字古典主义者(digitalclassistist_at_jiscmail_dot_ac_dot_uk) 法语DH(DH_at_groupes_dot_renater_dot_fr) 数字人文夏季研究所(Institute_at_lists_dot_uvic_dot_ca) 都柏林核心元数据数据倡议-文化遗产工作组(DC-Cultural-TG_at_jiscmail_dot_ac_dot_uk) 伊朗研究协会(listserv_at_societyforiraianstudies_dot_org)
附录二:工具评估目标
主要目标
它是什么用例和工作流 旨在 支持? 它还有哪些其他用例和工作流 能够 支持的? 能否通过将其与其他功能组合来填补功能上的空白 工具? 是否可以通过使用新的 发展? 要有效地使用它,需要什么技能? 需要哪些技能才能用新技能进行扩展 功能? 它在多大程度上支持数据管理最佳实践? (考虑 诸如资源的持久标识、版本控制、, 数据导入/导出、数据转换、标准数据格式、, 本体等)
它支持以下哪些高级用例 数字手稿内容: a.创建 b.治疗 c.出版 d.保存 e.合作 f.教育学 g.分析 h.其他
它支持以下哪种内容类型: a.元数据 b.文本 c.图像 d.注释 e.其他
-
永久标识符 它是否为您的数据提供稳定的标识符 物体? 什么类型? (URL、DOI、句柄、ARK、数据库标识符等) 它们是全局唯一的还是仅对 工具/平台? 它提供了什么方法来制作这些标识符 在上下文外持久和可解析 工具/平台? 它们的粒度级别是什么? (对象, 对象的片段、对象上的注释等) 除此之外,您能否为数据对象提供自己的PID 或代替平台分配的人员? 它支持标识符的版本控制吗?
对什么是数据对象有任何限制吗? 它是否提供了一种提供形式化、机器可操作的方法 数据对象的描述? 它是否支持数据的版本控制? 你能导出数据吗? 它是否提供了访问其数据的API? 它支持哪些数据类型格式? 您可以添加/定义自己的数据类型和格式吗? 它为发布链接的数据提供了什么支持 数据? 它为摄取或引用外部内容提供了什么支持 链接的数据源? 您可以将数据分组到集合中吗? 您可以拥有不同数据类型的多个集合吗? 您可以定义集合中项目之间的关系吗? 它提供了什么编目功能?
它是否支持OAI/PMH? a.用于出口? b.摄入/收获?
它支持哪些元数据词汇表? a.你能定义或提供自己的词汇吗?
它支持什么文本格式? a.纯文本、HTML、HOCR、标记、XML、PDF等。?
有上传文本内容的接口吗? a.从文件系统? b.从URL? c.是否支持批处理模式?
它是否支持将文本链接到其他对象(图像、, 外部站点、注释等)?
它支持哪些图像格式? a.JPG、PNG、TIFF等。
它支持IIIF API端点吗? 有上传图像的接口吗? a.从文件系统? b.从URL? c.是否支持批处理模式? d.是否支持3D可视化功能?
它是否支持将图像链接到其他对象(文本、, 外部站点、注释等)?
你能创建注释吗? a.在文本上? b.在图像上? c.在pdf上? d.其他?
注释是如何存储的? a.他们是否分配了与他们的项目不同的标识符 是否连接到?
它支持共享对象上的协作吗? 它是否支持实时协作(多个用户在 同一时间同一对象)? 它提供用户模型吗? 提供了哪些身份验证选项? a.OAuth2和社会身份提供者? b.希伯莱? c.用户名/密码? d.其他?
它支持组功能吗? 它支持用户角色吗? a.粒度级别? 单个对象? 应用范围? 项目?
它支持新功能的插件吗? 它是否提供了如何扩展的文档? 它是否为应用程序集成提供API? 扩展它需要什么编程语言? a.扩展需要什么技能水平?
它是否支持用于演示的自定义主题/样式表? 它支持移动设备吗? 是否有活跃的开发人员社区? 代码是否记录在案?
使用起来有多容易? 是否有用户帮助/文档? 有教程吗?