@phdthesis{外滩_PhD2022,TITLE={无危险时钟同步},作者={Bund,Johannes},URL={urn:nbn:de:bsz:291--ds-404463},DOI={10.22028/D291-40446},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
@phdthesis{Chuphd2022,TITLE={从虚构文本中提取知识},作者={Chu,Cuong Xuan},语言={eng},URL={nbn:de:bsz:291--ds-361070},DOI={10.22028/D291-36107},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={从文本中提取知识是自然语言处理中的一项关键任务,它涉及到许多子任务,如分类法归纳、命名实体识别和键入、关系提取、知识规范化等。通过从自然语言文本构建结构化知识,知识提取成为搜索引擎、问答和其他下游应用程序的关键资产。然而,当前的知识提取方法主要集中于以维基百科和主流新闻文章为来源的突出的现实世界实体。因此,构建的知识库缺乏长尾领域的信息,以虚构和幻想为原型。小说和幻想是我们人类文化的核心部分,从文学到电影、电视剧、漫画和视频游戏。由于已经创建了数千个虚构的宇宙,来自虚构领域的知识成为了搜索引擎查询的主题,无论是粉丝还是文化分析师都会进行查询。与现实世界领域不同,在诸如小说和幻想等特定领域的知识提取必须解决几个关键挑战:——培训数据:虚构领域的来源大多来自书籍和虚构内容,这些内容稀少且杂乱,并且包含复杂的文本结构,如对话和引用。关键任务(如分类归纳、命名实体类型或关系提取)的培训数据也不可用领域特征和多样性:虚构世界可能非常复杂,包含实体、社会结构,有时还包含与现实世界完全不同的语言。最先进的知识提取方法对实体类、子类和实体-实体关系进行了假设,这些假设通常对虚拟领域无效。对于不同类型的虚构领域,另一个要求是跨领域传输模型长的虚构文本:虽然最先进的模型对输入序列长度有限制,但开发能够处理很长文本(例如整本书)的方法,以捕获多个上下文并利用广泛传播的线索,这一点至关重要。本文通过开发新的方法来解决上述挑战,从而提高虚拟领域中知识提取的技术水平第一个贡献是一种称为TiFi的方法,用于构建虚拟域的类型系统(分类归纳)。TiFi通过挖掘Wikia等在线社区中嘈杂的粉丝内容,通过三个主要步骤进行分类:类别清理、边缘清理和顶级构建。TiFi利用原始输入的各种特征,能够高精度地为各种虚构领域构建分类法第二个贡献是一种称为ENTYFI的综合方法,用于命名实体识别和在长的虚构文本中键入。ENTYFI建立在205个为流行的虚构域自动生成的高质量类型系统之上,利用这些虚构域在未看到的文本上的重叠和重用。通过将不同的键入模块与合并阶段相结合,ENTYFI能够以高精度和召回率在长虚构文本中进行细粒度实体键入第三个贡献是一个称为KnowFi的端到端系统,用于提取非常长的文本(如整本书)中实体之间的关系。KnowFi利用142个流行虚构领域的背景知识来确定有趣的关系并收集远程培训样本。KnowFi设计了一种基于相似性的排名技术,以减少训练样本中的误报,并选择包含实体种子对的潜在文本段落。通过为所有关系训练一个层次化神经网络,KnowFi能够在长的虚构文本中推断实体对之间的关系,并获得优于最佳先前关系提取方法的收益。},}
@博士学位{Decarvalhophd2021,TITLE={分析有争议的社交媒体讨论的数据科学方法},作者={Guimar{\~a}es,Anna},语言={eng},URL={nbn:de:bsz:291--ds-365021},DOI={10.22028/D291-36502},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={像Reddit和Twitter这样的社交媒体社区允许用户就他们感兴趣的主题发表自己的观点,并与可能分享或反对这些观点的其他用户进行交流。<br>这可能会导致富有成效的讨论,以达成共识,或引发激烈的辩论,而分歧经常会出现主要关注于识别明显的反社会行为实例,如仇恨言论和控制社区健康的可能威胁。然而,这些都是异常严重的现象,不包括由用户辩论、意见分歧和非主题内容引起的争议,所有这些都可以在讨论中自然提出,而不会影响其发展<br>本文提出了一个框架,用于系统分析社交媒体讨论<br>,这些讨论是在存在争议主题、分歧和参与用户的混合意见的情况下进行的。为此,我们开发了一个基于特征的模型来描述讨论的关键要素,例如讨论的突出主题、用户的活动水平、它表达的情感、以及它收到的用户反馈<br>最初,我们构建了我们的功能模型,以描述围绕推特上政治活动的对抗性讨论,重点关注其主题的事实性和情感性,以及不同用户所扮演的角色。然后,我们将我们的方法扩展到Reddit<br>讨论,利用社区反馈信号来定义争议的新概念<br>,并强调频繁有趣的互动模式产生的对话原型<br>。我们使用我们的特征模型构建逻辑回归分类器,可以预测未来Reddit社区中以政治、世界新闻、体育和人际关系为中心的争议实例。最后,我们的模型还为卫生领域中不同社区的比较提供了基础,尽管这些社区的主题和活动有着共同的整体关注点,但它们之间的差异很大。在每一种情况下,我们的框架都提供了对用户行为如何影响社区对争议的个人定义及其整体身份的见解,}
@ph值{Hladky_PhD22,TITLE={使用来自强大服务器的解耦流式渲染在瘦客户端上进行延迟隐藏和高保真新视图合成},作者={Hladk{\'y},Jozef},语言={eng},URL={urn:nbn:de:bsz:291-ds-376882},DOI={10.22028/D291-37688},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
@博士学位{HornakovaPhD22,TITLE={提升边缘作为多切割和不相交路径的连接先验信息},作者={Hor{vn}{\'a}kov{\'a},Andrea},语言={eng},URL={urn:nbn:de:bsz:291--ds-369193},DOI={10.22028/D291-36919},学校={University{\“a}t des Saarlandes},地址={萨尔布尔{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
@phdthesis{Ho_PhD2022,TITLE={具有数量的实体:提取、搜索和排名},作者={Ho,Vinh Thinh},语言={eng},URL={urn:nbn:de:bsz:291--ds-380308},DOI={10.22028/D291-38030},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
@phdthesis{Attilaphd2022,TITLE={时间测量系统中的定时、时间同步和噪声},作者={Kinali Dogan,Attila},语言={eng},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
@ph值{NusserPhD22,TITLE={几何相似度量的细粒度复杂性和算法工程},作者={Nusser,Andr{\'e}},语言={eng},URL={urn:nbn:de:bsz:291--ds-370184},DOI={10.22028/D291-37018},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},}
@博士学位{Stutzphd2022,TITLE={理解和改进深度学习中的稳健性和不确定性估计},作者={Stutz,David},语言={eng},URL={nbn:de:bsz:291--ds-372867},DOI={10.22028/D291-37286},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={深度学习越来越适用于许多高风险的应用,如自动驾驶或医疗诊断,在这些应用中,错误的决策可能会对人类生活产生巨大影响。不幸的是,深度神经网络通常只基于泛化来评估,例如,在固定测试集上的准确性。然而,这显然是不正确的有效地进行安全部署,因为潜在的恶意行为体和分布转移或量化和不可靠硬件的影响被忽略。因此,最近的工作额外评估了潜在操纵或损坏输入的性能,以及量化和在专用硬件上部署后的性能。在这种情况下,获得模型置信度的合理估计及其预测也很重要。本文主要从三个方向研究深度学习中的鲁棒性和不确定性估计:首先,我们考虑所谓的对抗性示例,轻微扰动的输入会导致精度严重下降。其次,我们研究权重扰动,特别关注量化权重中的比特误差。这与在专用硬件上部署模型以实现高效推理有关,即所谓的加速器。最后,我们处理不确定性估计,以提高鲁棒性,并为安全部署提供有意义的统计性能保证。详细地,我们研究了关于底层数据流形的对抗性示例的存在性。在这种情况下,我们还研究了对抗训练,它通过以降低准确性为代价,用对抗示例增强训练来提高鲁棒性。我们表明,常规对抗性示例使数据流形几乎正交。虽然我们发现健壮性和准确性之间没有内在的权衡,但这导致了更高的样本复杂度以及对抗训练的严重过拟合。使用关于权重变化的鲁棒损失图中平面度的新度量,我们还表明鲁棒过拟合是由收敛到特别尖锐的最小值引起的。事实上,我们发现平坦度和良好的鲁棒泛化之间存在明显的相关性。此外,我们还研究了量化权重中的随机和对抗性比特错误。在加速器中,当以提高能源效率为目标降低电压时,存储器中会出现随机位错误。在这里,我们考虑一种稳健的量化方案,使用权重剪裁作为正则化,并执行随机误码训练以提高误码鲁棒性,从而在不需要硬件更改的情况下节省大量能量。相反,恶意的比特错误是通过基于硬件或软件的内存攻击恶意引入的,会严重影响性能。我们提出了一种新的对抗性误码攻击来研究这种威胁,并使用对抗性的误码训练来提高鲁棒性,从而提高加速器的安全性。最后,我们在不确定性估计的背景下看待稳健性。通过鼓励对对抗性示例进行低置信度预测,我们的信任校准对抗性训练在测试时成功地拒绝了对抗性示例、腐败示例和分发外示例。因此,与常规对抗训练相比,我们还能够改进鲁棒性与准确性之间的权衡。然而,即使是健壮的模型也不能为安全部署提供任何保证。为了解决这个问题,保角预测允许模型预测置信集,并保证包含真实标签。不幸的是,由于保角预测通常是在训练后应用的,所以训练模型时没有考虑这个校准步骤。为了解决这一限制,我们提出了保形训练,它允许使用底层模型端到端地训练保形预测因子。这不仅提高了获得的不确定性估计值,还可以优化特定应用的目标,而不会失去所提供的保证。除了我们在稳健性或不确定性方面的工作外,我们还解决了部分观测点云的3D形状完成问题。具体来说,我们认为,在自动驾驶或机器人设置中,车辆通常配备激光雷达或深度传感器,获得完整的环境3D表示至关重要。然而,应用深度学习技术所必需的基本事实形状极难获得。因此,我们提出了一种弱监督方法,可以在不完整的点云上进行训练,同时提供有效的推理。总之,本文有助于我们理解对输入和权重扰动的鲁棒性。为此,我们还开发了提高稳健性的方法以及不确定性估计,以便在高风险应用中安全部署深度学习方法。在自动驾驶的特定背景下,我们还讨论稀疏点云的3D形状完成。},}
@phdthesis{Tiguphd2022,TITLE={从对话中提取个人信息},作者={蒂古诺娃,安娜},语言={eng},URL={nbn:de:bsz:291--ds-356280},DOI={10.22028/D291-35628},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={个人知识是一种多用途的资源,对广泛的下游应用程序很有价值。有关用户的背景信息可以让聊天机器人助理生成更多的主题和同理心回复。在推荐和检索模型的上下文中,个人信息可以用于为个人用户自定义排名结果Personal Knowledge Base是存储和查询个人知识的唯一端点,其中包含个人事实,如人口统计信息、兴趣和人际关系。此类知识库易于解释,可以为用户提供对其个人知识的完全控制,包括修改存储的事实和管理下游服务的访问,以实现个性化。为了减轻用户构建此类个人知识库的大量手动工作,我们可以利用应用于用户文本内容的自动提取方法,例如对话记录或社交媒体帖子。主流提取方法专门针对结构良好的数据,如传记文本或百科全书文章,这对大多数人来说都是罕见的。反过来,会话数据丰富,但处理起来很有挑战性,需要专门的方法来提取个人事实。在本论文中,我们讨论了从会话数据中获取个人知识。我们提出了几种新的深度学习模型来推断说话者的个人属性:通过具有注意机制的层次神经分类器HAMs来推断人口统计属性,如年龄、性别、职业和家庭状况。经过训练的HAM可以在不同类型的会话数据之间传输,并提供可解释的预测。\mbox{$\bullet$}使用CHARM(一种零快照学习模型)预测了长期的个人属性、爱好和职业,克服了缺乏针对罕见属性值的标记训练样本的问题。通过将对话话语与外部来源联系起来,CHARM能够预测训练期间从未见过的属性值。\mbox{$\bullet$}人际关系是通过PRIDE(一种基于层次变换器的模型)推断出来的。为了准确预测细粒度的关系,PRIDE利用了说话人的个人特征和对话的风格。对各种对话文本的实验,包括Reddit讨论和电影脚本,证明了我们的方法的可行性以及与最新基线相比的优越性能。},}
@phdthesis{王家义_PhD2023,TITLE={{3D}基于模型先验的单目相机手部重建},作者={Wang,Jiayi},URL={urn:nbn:de:bsz:291--ds-399055},DOI={10.22028/D291-39905},学校={University{\“a}t des Saarlandes},地址={萨尔布尔{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}