前年

博士
[1]
J.Bund,“无危险时钟同步”,萨尔兰德大学,萨尔布吕肯,2022年。
导出
BibTeX公司
@phdthesis{外滩_PhD2022,TITLE={无危险时钟同步},作者={Bund,Johannes},URL={urn:nbn:de:bsz:291--ds-404463},DOI={10.22028/D291-40446},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
尾注
%0论文%外滩,约翰内斯%Y Blä马库斯爵士%裁判:克里斯托夫·伦赞%裁判:Fü马蒂亚斯·格尔%裁判:梅尔霍恩,库尔特%+算法与复杂性,信息学MPI,马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会外部组织算法与复杂性,信息学MPI,马克斯·普朗克学会算法与复杂性,信息学MPI,马克斯·普朗克学会算法与复杂性,信息学MPI,马克斯·普朗克学会%T无危险时钟同步:%U型http://hdl.handle.net/21.11116/0000-000D-D178-0%图:nbn:de:bsz:291--ds-404463%10.22028/D291-40446兰特%其他:hdl:20.500.11880/36387%I大学ä萨朗德斯%C Saarbrü科恩%D 2022年%12页,180页。%电压phd%9博士%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/36387
[2]
C.X.Chu,“从小说文本中提取知识”,萨尔兰德大学,萨尔布吕肯,2022年。
摘要
从文本中提取知识是自然语言处理中的一项关键任务,它涉及到许多子任务,如分类归纳、命名实体识别和类型化、关系提取、知识规范化等,知识提取成为搜索引擎、问答和其他下游应用程序的关键资产。然而,当前的知识提取方法主要集中于以维基百科和主流新闻文章为来源的突出的现实世界实体。因此,构建的知识库缺乏长尾领域的信息,以虚构和幻想为原型。小说和幻想是我们人类文化的核心部分,从文学到电影、电视剧、漫画和电子游戏。由于已经创建了数千个虚构的宇宙,来自虚构领域的知识成为了粉丝和文化分析师搜索引擎查询的主题。与现实世界领域不同,小说和幻想等特定领域的知识提取必须解决几个关键挑战:培训数据:虚构领域的来源大多来自书籍和虚构内容,这些内容稀少且杂乱,并且包含复杂的文本结构,如对话和引用。关键任务(如分类归纳、命名实体类型或关系提取)的培训数据也不可用领域特征和多样性:虚构世界可能非常复杂,包含实体、社会结构,有时还包含与现实世界完全不同的语言。最先进的知识提取方法对实体类、子类和实体-实体关系进行了假设,这些假设通常对虚拟领域无效。对于不同类型的虚拟域,另一个要求是跨域传输模型长的虚构文本:虽然最先进的模型对输入序列长度有限制,但开发能够处理很长文本(例如整本书)的方法,以捕获多个上下文并利用广泛传播的线索,这一点至关重要。本文通过开发新的方法来解决上述挑战,从而提高虚拟领域中知识提取的技术水平第一个贡献是一种称为TiFi的方法,用于构建虚拟域的类型系统(分类归纳)。TiFi通过挖掘Wikia等在线社区中嘈杂的粉丝内容,通过三个主要步骤进行分类:类别清理、边缘清理和顶级构建。TiFi利用原始输入的各种特征,能够高精度地为各种虚构领域构建分类法第二个贡献是一种称为ENTYFI的综合方法,用于命名实体识别和在长的虚构文本中键入。ENTYFI建立在流行虚构领域的205个自动诱导的高质量类型系统之上,利用了这些虚构领域在看不见的文本上的重叠和重用。通过将不同的键入模块与合并阶段相结合,ENTYFI能够以高精度和召回率在长虚构文本中进行细粒度实体键入第三个贡献是一个称为KnowFi的端到端系统,用于提取非常长的文本(如整本书)中实体之间的关系。KnowFi利用142个流行虚构领域的背景知识来确定有趣的关系并收集远程培训样本。KnowFi设计了一种基于相似性的排名技术,以减少训练样本中的误报,并选择包含实体种子对的潜在文本段落。通过为所有关系训练一个层次化神经网络,KnowFi能够在长的虚构文本中推断实体对之间的关系,并获得优于最佳先前关系提取方法的收益。
导出
BibTeX公司
@phdthesis{Chuphd2022,TITLE={从虚构文本中提取知识},作者={Chu,Cuong Xuan},语言={eng},URL={nbn:de:bsz:291--ds-361070},DOI={10.22028/D291-36107},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={从文本中提取知识是自然语言处理中的一项关键任务,它涉及到许多子任务,如分类法归纳、命名实体识别和键入、关系提取、知识规范化等。通过从自然语言文本构建结构化知识,知识提取成为搜索引擎、问答和其他下游应用程序的关键资产。然而,当前的知识提取方法主要集中于以维基百科和主流新闻文章为来源的突出的现实世界实体。因此,构建的知识库缺乏长尾领域的信息,以虚构和幻想为原型。小说和幻想是我们人类文化的核心部分,从文学到电影、电视剧、漫画和视频游戏。由于已经创建了数千个虚构的宇宙,来自虚构领域的知识成为了搜索引擎查询的主题,无论是粉丝还是文化分析师都会进行查询。与现实世界领域不同,在诸如小说和幻想等特定领域的知识提取必须解决几个关键挑战:——培训数据:虚构领域的来源大多来自书籍和虚构内容,这些内容稀少且杂乱,并且包含复杂的文本结构,如对话和引用。关键任务(如分类归纳、命名实体类型或关系提取)的培训数据也不可用领域特征和多样性:虚构世界可能非常复杂,包含实体、社会结构,有时还包含与现实世界完全不同的语言。最先进的知识提取方法对实体类、子类和实体-实体关系进行了假设,这些假设通常对虚拟领域无效。对于不同类型的虚构领域,另一个要求是跨领域传输模型长的虚构文本:虽然最先进的模型对输入序列长度有限制,但开发能够处理很长文本(例如整本书)的方法,以捕获多个上下文并利用广泛传播的线索,这一点至关重要。本文通过开发新的方法来解决上述挑战,从而提高虚拟领域中知识提取的技术水平第一个贡献是一种称为TiFi的方法,用于构建虚拟域的类型系统(分类归纳)。TiFi通过挖掘Wikia等在线社区中嘈杂的粉丝内容,通过三个主要步骤进行分类:类别清理、边缘清理和顶级构建。TiFi利用原始输入的各种特征,能够高精度地为各种虚构领域构建分类法第二个贡献是一种称为ENTYFI的综合方法,用于命名实体识别和在长的虚构文本中键入。ENTYFI建立在205个为流行的虚构域自动生成的高质量类型系统之上,利用这些虚构域在未看到的文本上的重叠和重用。通过将不同的键入模块与合并阶段相结合,ENTYFI能够以高精度和召回率在长虚构文本中进行细粒度实体键入第三个贡献是一个称为KnowFi的端到端系统,用于提取非常长的文本(如整本书)中实体之间的关系。KnowFi利用142个流行虚构领域的背景知识来确定有趣的关系并收集远程培训样本。KnowFi设计了一种基于相似性的排名技术,以减少训练样本中的误报,并选择包含实体种子对的潜在文本段落。通过为所有关系训练一个层次化神经网络,KnowFi能够在长的虚构文本中推断实体对之间的关系,并获得优于最佳先前关系提取方法的收益。},}
尾注
%0论文%阿楚、匡轩%Y Weikum,格哈德%裁判:马丁·西奥博尔德%+数据库和信息系统、信息学MPI、马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会%从小说文本中提取知识:%G工程%U型http://hdl.handle.net/21.11116/0000-000A-9598-2%10.22028/D291-36107兰特%电话号码:de:bsz:291--ds-361070%其他:hdl:20.500.11880/32914%I大学ä萨朗德斯%C萨尔布尔ü科恩%D 2022年%第129页。%V博士%9博士%X从文本中提取知识是自然语言处理中的一项关键任务,它涉及许多子任务,如分类归纳、命名实体识别和类型化、关系提取、知识规范化等,知识提取成为搜索引擎、问答和其他下游应用程序的关键资产。然而,当前的知识提取方法主要集中于以维基百科和主流新闻文章为来源的突出的现实世界实体。因此,构建的知识库缺乏长尾领域的信息,以虚构和幻想为原型。小说和幻想是我们人类文化的核心部分,从文学到电影、电视剧、漫画和视频游戏。随着成千上万的虚构世界的创建,来自虚构领域的知识成为搜索引擎查询的主题——粉丝和文化分析师都在查询。与现实世界领域不同,小说和幻想等特定领域的知识提取必须解决几个关键挑战:培训数据:虚构领域的来源大多来自书籍和虚构内容,这些内容稀少且杂乱,并且包含复杂的文本结构,如对话和引用。关键任务(如分类归纳、命名实体类型或关系提取)的培训数据也不可用领域特征和多样性:虚构世界可能非常复杂,包含实体、社会结构,有时还包含与现实世界完全不同的语言。最先进的知识提取方法对实体类、子类和实体-实体关系进行了假设,这些假设通常对虚拟领域无效。对于不同类型的虚拟域,另一个要求是跨域传输模型长的虚构文本:虽然最先进的模型对输入序列长度有限制,但开发能够处理很长文本(例如整本书)的方法,以捕获多个上下文并利用广泛传播的线索,这一点至关重要。本文通过开发新的方法来解决上述挑战,从而提高虚拟领域中知识提取的技术水平第一个贡献是一种称为TiFi的方法,用于构建虚拟域的类型系统(分类归纳)。TiFi通过挖掘Wikia等在线社区中嘈杂的粉丝内容,通过三个主要步骤进行分类:类别清理、边缘清理和顶级构建。TiFi利用原始输入的各种特征,能够高精度地为各种虚构领域构建分类法第二个贡献是一种称为ENTYFI的综合方法,用于命名实体识别和在长的虚构文本中键入。ENTYFI建立在205个为流行的虚构域自动生成的高质量类型系统之上,利用这些虚构域在未看到的文本上的重叠和重用。通过将不同的打字模块与合并阶段相结合,ENTYFI能够在长虚构文本中进行细粒度的实体打字,具有高精度和高召回率第三个贡献是一个称为KnowFi的端到端系统,用于提取非常长的文本(如整本书)中实体之间的关系。KnowFi利用142个流行虚构领域的背景知识来确定有趣的关系并收集远程培训样本。KnowFi设计了一种基于相似性的排名技术,以减少训练样本中的误报,并选择包含实体种子对的潜在文本段落。通过为所有关系训练一个层次化神经网络,KnowFi能够在长的虚构文本中推断实体对之间的关系,并获得优于最佳先前关系提取方法的收益。%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/32914
[3]
J.Fischer,“超过其部分的总和”,萨尔兰德大学,萨尔布吕肯,2022年。
摘要
在本论文中,我们探讨了模式挖掘和深度学习。通常被视为正交的,我们表明这些领域相辅相成,并建议将它们结合起来,以获取彼此的优势。首先,我们展示了如何有效地发现简洁和非冗余的模式集,这些模式集提供了对连接语句之外的数据的洞察力。我们利用这些模式的可解释性来揭示信息如何和哪些信息通过神经网络流动,以及它们的决策具有什么特征。相反,我们展示了如何将连续优化与模式发现相结合,提出了一种直接编码离散模式的神经网络,它允许我们以比以前更大的数量级应用模式挖掘。然而,大型神经网络的训练成本极高,而“彩票”(随机初始化的神经网络中的小型、可训练性好的子网络)可以提供一种补救方法。我们确定了强票的理论局限性,并通过使这些票具有普遍近似的性质来克服这些局限性。为了分析彩票稀疏性的限制是算法上的还是根本上的,我们提出了一个框架来植入和隐藏彩票。通过新的票务基准,我们得出结论,限制可能是算法性的,这鼓励了我们的框架提供了测量进展的方法的进一步发展。
导出
BibTeX公司
@phdthesis{Fischerphd2022,TITLE={大于其部分之和},作者={菲舍尔,乔纳斯},语言={eng},URL={nbn:de:bsz:291--ds-370240},DOI={10.22028/D291-37024},学校=萨尔州大学,地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},在本论文中,我们探讨了模式挖掘和深度学习。通常被视为正交的,我们表明这些领域相互补充,并建议将它们结合起来,以从彼此的优势中获益。首先,我们展示了如何有效地发现简洁和非冗余的模式集,这些模式集提供了对连接语句之外的数据的洞察力。我们利用这些模式的可解释性来揭示信息如何和哪些信息通过神经网络流动,以及它们的决策具有什么特征。相反,我们展示了如何将连续优化与模式发现相结合,提出了一种直接编码离散模式的神经网络,它允许我们以比以前更大的数量级应用模式挖掘。然而,大型神经网络的训练成本非常昂贵,而彩票(随机初始化的神经网络中的可训练性很好的小个子网络)提供了一种补救方法。我们确定了强票据的理论局限性,并通过赋予这些票据普遍逼近的性质来克服它们。为了分析彩票稀疏性的限制是算法上的还是根本上的,我们提出了一个框架来植入和隐藏彩票。通过新的票务基准,我们得出结论,限制可能是算法上的,这鼓励了进一步的发展,我们的框架提供了衡量进展的方法。},}
尾注
%0论文%乔纳斯·A·菲舍尔%Y Vreeken,Jilles公司%裁判:Weikum,Gerhard%裁判:Parthasarathy,Srinivasan%+数据库和信息系统、信息学MPI、马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会外部组织%模式挖掘神经网络及其互补性%G工程%U型http://hdl.handle.net/21.11116/0000-000B-38BF-0%10.22028/D291-37024兰特%电话号码:de:bsz:291--ds-370240%其他:hdl:20.500.11880/33893%I大学ä萨朗德斯%C Saarbrü科恩%D 2022年%第250页。%V博士%9博士%X在本论文中,我们探索了模式挖掘和深度学习。通常被视为正交的,我们表明这些字段相互补充,并建议将它们组合起来,以从彼此中获益’的优势。首先,我们展示了如何有效地发现简洁和非冗余的模式集,这些模式集提供了对连接语句之外的数据的洞察力。我们利用这些模式的可解释性来揭示信息如何和哪些信息通过神经网络流动,以及它们的决策具有什么特征。相反,我们展示了如何将连续优化与模式发现相结合,提出了一种直接编码离散模式的神经网络,它允许我们以比以前更大的数量级应用模式挖掘。然而,大型神经网络的训练成本非常昂贵,‘彩票– 随机初始化神经网络中的小型、可训练性好的子网络–提供补救措施。我们确定了强票据的理论局限性,并通过赋予这些票据普遍逼近的性质来克服它们。为了分析彩票稀疏性的限制是算法上的还是根本上的,我们提出了一个框架来植入和隐藏彩票。通过新的票务基准,我们得出结论,限制可能是算法性的,这鼓励了我们的框架提供了测量进展的方法的进一步发展。%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/33893
[4]
A.Guimaráes,“分析有争议的社交媒体讨论的数据科学方法”,萨尔兰德大学,萨尔布吕肯,2022年。
摘要
Reddit和Twitter等社交媒体社区允许用户就自己感兴趣的主题发表自己的观点,并与可能分享或反对这些观点的其他用户进行交流<br>这可能会导致富有成效的讨论,以达成共识,或引发激烈的辩论,<br>分歧经常出现<br>之前在此类环境中的工作主要集中在识别反社会行为的显著实例,如仇恨言论和“巨魔”,这些行为可能对<br>社区的健康构成威胁。然而,这些都是异常严重的现象,不包括由用户辩论、意见分歧和非主题内容引起的争议,所有这些都可以在讨论中自然提出,而不会影响其发展<br>本文提出了一个框架,用于系统分析社交媒体讨论<br>,这些讨论是在存在争议主题、分歧和参与用户的混合意见的情况下进行的。为此,我们开发了一个基于特征的模型来描述讨论的关键要素,例如讨论的突出主题、用户的活动水平、它表达的情感、以及它收到的用户反馈<br>最初,我们构建了我们的功能模型,以描述围绕推特上政治活动的对抗性讨论,重点关注其主题的事实性和情感性,以及不同用户所扮演的角色。然后,我们将我们的方法扩展到Reddit讨论,利用社区反馈信号定义新的争议概念,并强调频繁有趣的交互模式产生的会话原型。我们使用我们的特征模型构建逻辑回归分类器,可以预测未来Reddit社区中以政治、世界新闻、体育和人际关系为中心的争议实例。最后,我们的模型还为卫生领域中不同社区的比较提供了基础,尽管这些社区的主题和活动有着共同的整体关注点,但它们之间的差异很大。在每一种情况下,我们的框架都提供了对用户行为如何影响社区对争议的个人定义及其整体身份的见解。
导出
BibTeX公司
@博士学位{Decarvalhophd2021,TITLE={分析有争议的社交媒体讨论的数据科学方法},作者={Guimar{\~a}es,Anna},语言={eng},URL={nbn:de:bsz:291--ds-365021},DOI={10.22028/D291-36502},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={像Reddit和Twitter这样的社交媒体社区允许用户就他们感兴趣的主题发表自己的观点,并与可能分享或反对这些观点的其他用户进行交流。<br>这可能会导致富有成效的讨论,以达成共识,或引发激烈的辩论,而分歧经常会出现主要关注于识别明显的反社会行为实例,如仇恨言论和控制社区健康的可能威胁。然而,这些都是异常严重的现象,不包括由用户辩论、意见分歧和非主题内容引起的争议,所有这些都可以在讨论中自然提出,而不会影响其发展<br>本文提出了一个框架,用于系统分析社交媒体讨论<br>,这些讨论是在存在争议主题、分歧和参与用户的混合意见的情况下进行的。为此,我们开发了一个基于特征的模型来描述讨论的关键要素,例如讨论的突出主题、用户的活动水平、它表达的情感、以及它收到的用户反馈<br>最初,我们构建了我们的功能模型,以描述围绕推特上政治活动的对抗性讨论,重点关注其主题的事实性和情感性,以及不同用户所扮演的角色。然后,我们将我们的方法扩展到Reddit<br>讨论,利用社区反馈信号来定义争议的新概念<br>,并强调频繁有趣的互动模式产生的对话原型<br>。我们使用我们的特征模型构建逻辑回归分类器,可以预测未来Reddit社区中以政治、世界新闻、体育和人际关系为中心的争议实例。最后,我们的模型还为卫生领域中不同社区的比较提供了基础,尽管这些社区的主题和活动有着共同的整体关注点,但它们之间的差异很大。在每一种情况下,我们的框架都提供了对用户行为如何影响社区对争议的个人定义及其整体身份的见解,}
尾注
%0论文%吉马&#227;是的,安娜%Y Weikum,格哈德%裁判:德梅洛,杰拉德%裁判:安德鲁·耶茨%+数据库和信息系统、信息学MPI、马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会数据库和信息系统,信息学MPI,马克斯·普朗克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会%T数据科学分析方法有争议的社交媒体讨论:%G工程%U型http://hdl.handle.net/21.11116/0000-000A-CDF7-9%10.22028/D291-36502兰特%电话号码:de:bsz:291--ds-365021%其他:hdl:20.500.11880/33161%I大学&#228;萨朗德斯%C Saarbr&#252;科恩%D 2022年%第94页。%V博士%9博士%像Reddit和Twitter这样的X社交媒体社区允许用户表达他们对<br>感兴趣的话题的看法,并与其他可能分享或反对这些观点的用户接触<br>这可能会导致富有成效的讨论,以达成共识,或引发激烈的辩论,<br>分歧经常出现<br>之前在此类环境下的工作主要集中在识别明显的反社会行为,如仇恨言论和&#8220;滚动&#8221;,这可能对社区的健康构成威胁。然而,这些都是异常严重的现象,不包括由用户辩论、意见分歧和非主题内容引起的争议,所有这些都可以在讨论中自然提出,而不会影响其发展<br>本文提出了一个框架,用于系统分析社交媒体讨论<br>,这些讨论是在存在争议主题、分歧和参与用户的混合意见的情况下进行的。为此,我们开发了一个基于特征的模型来描述讨论的关键要素,例如讨论的突出主题、用户的活动水平、它表达的情感、以及它收到的用户反馈<br>最初,我们构建了我们的功能模型,以描述围绕推特上政治活动的对抗性讨论,重点关注其主题的事实性和情感性,以及不同用户所扮演的角色。然后,我们将我们的方法扩展到Reddit讨论,利用社区反馈信号定义新的争议概念,并强调频繁有趣的交互模式产生的会话原型。我们使用我们的特征模型来构建逻辑回归分类器,该分类器可以预测Reddit社区中以政治、世界新闻、体育和<br>个人关系为中心的未来<br>争议实例。最后,我们的模型还为卫生领域中不同社区的比较提供了基础,尽管这些社区的主题和活动有着共同的整体关注点,但它们之间的差异很大。在每一种情况下,我们的框架都提供了对用户行为如何塑造社区的洞察力&#8217;个人对争议的定义及其整体认同。%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/33161
[5]
J.Hladkí,“使用强大服务器的解耦流媒体渲染在瘦客户端上进行延迟隐藏和高保真新视图合成”,萨尔兰德斯大学,萨尔布吕肯,2022年。
导出
BibTeX公司
@ph值{Hladky_PhD22,TITLE={使用来自强大服务器的解耦流式渲染在瘦客户端上进行延迟隐藏和高保真新视图合成},作者={Hladk{\'y},Jozef},语言={eng},URL={urn:nbn:de:bsz:291-ds-376882},DOI={10.22028/D291-37688},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
尾注
%0论文%阿哈拉克&#253;,乔泽夫%汉斯·彼得·塞德尔%裁判:斯坦伯格,马库斯%裁判:托拜厄斯·里切尔%+计算机制图、信息学MPI、马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会计算机制图、信息学MPI、马克斯·普朗克学会计算机制图、信息学MPI、马克斯·普朗克学会计算机制图、信息学MPI、马克斯·普朗克学会%使用强大服务器的解耦流渲染在瘦客户端上实现T延迟隐藏和高保真新颖视图合成:%G工程%U型http://hdl.handle.net/21.11116/0000-000F-24A1-2%10.22028/D291-37688兰特%图:nbn:de:bsz:291--ds-376882%其他:hdl:20.500.11880/34640%I大学&#228;萨朗德斯%C Saarbr&#252;科恩%D 2022年%V博士%9小时%U型https://scidok.sulb.uni-saarland.de/handle/20.500.11880/34640
[6]
A.Horňáková,“提升边缘作为多切割和不相交路径的连接优先因素”,萨尔兰德斯大学,萨尔布吕肯,2022年。
导出
BibTeX公司
@博士学位{HornakovaPhD22,TITLE={提升边缘作为多切割和不相交路径的连接先验信息},作者={Hor{vn}{\'a}kov{\'a},Andrea},语言={eng},URL={urn:nbn:de:bsz:291--ds-369193},DOI={10.22028/D291-36919},学校={University{\“a}t des Saarlandes},地址={萨尔布尔{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
尾注
%0论文%一个水平&#328&#225;科夫;,安德莉亚%保罗·Y·斯沃博达%裁判:席勒,伯恩特%裁判:沃纳,汤姆&#225&#353;%+计算机视觉和机器学习,信息学MPI,马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会计算机视觉和机器学习,信息学MPI,马克斯·普朗克学会计算机视觉和机器学习,信息学MPI,马克斯·普朗克学会外部组织%T提升边缘作为多截和不相交路径的连接先验:%G工程%U型http://hdl.handle.net/21.11116/0000-000B-2AD2-9%图:nbn:de:bsz:291--ds-369193%R 10.22028/日期291-36919%其他:hdl:20.500.11880/33680%I大学&#228;萨朗德斯%C Saarbr&#252;科恩%D 2022年%P X,150页。%V博士%9博士%U型http://dx.doi.org/10.22028/D291-36919
[7]
V.T.Ho,“有数量的实体:提取、搜索和排名”,萨尔州大学,萨尔布吕肯,2022年。
导出
BibTeX公司
@phdthesis{Ho_PhD2022,TITLE={具有数量的实体:提取、搜索和排名},作者={Ho,Vinh Thinh},语言={eng},URL={urn:nbn:de:bsz:291--ds-380308},DOI={10.22028/D291-38030},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
尾注
%0论文%阿浩,Vinh Thinh%Y Weikum,格哈德%裁判:斯蒂芬诺娃,达里亚%裁判:马丁·西奥博尔德%+数据库和信息系统、信息学MPI、马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会%具有数量的T实体:提取、搜索和排名:%G工程%U型http://hdl.handle.net/21.11116/0000-000C-B756-5%10.22028/D291-38030兰特%图:nbn:de:bsz:291--ds-380308%其他:hdl:20.500.11880/34538%I大学&#228;萨尔州%C Saarbr&#252;科恩%D 2022年%12页,131页。%V博士%9博士%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/34538
[8]
A.Kinali-Dogan,“时间测量系统中的时间、时间同步和噪声”,萨尔兰德大学,萨尔布吕肯,2022年。
导出
BibTeX公司
@phdthesis{Attilaphd2022,TITLE={时间测量系统中的定时、时间同步和噪声},作者={Kinali Dogan,Attila},语言={eng},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
尾注
%0论文%A Kinali-Dogan,阿提拉%Y Lenzen,克里斯托夫%裁判:梅尔霍恩,库尔特%裁判:佛朗索瓦·维诺特%+算法与复杂性,信息学MPI,马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会算法与复杂性,信息学MPI,马克斯·普朗克学会算法与复杂性,信息学MPI,马克斯·普朗克学会外部组织%时间测量系统中的时间、时间同步和噪声:%G工程%U型http://hdl.handle.net/11.1116/0000-000B-5436-A%I大学&#228;萨朗德斯%C Saarbr&#252;科恩%D 2022年%P 140页。%V博士%9博士
[9]
P.Lahoti,“为负责任的机器学习实现公平操作”,萨尔兰德斯大学,萨尔布吕肯,2022年。
摘要
随着机器学习(ML)越来越多地用于影响人类的场景中的决策制定,人们越来越意识到其潜在的不公平性。最近的大量工作集中于在ML中提出正式的公平概念,以及减轻不公平的方法。然而,洗钱公平文献与实际操作公平的需要之间的脱节越来越严重。本论文通过开发新的模型和方法来解决在实践中实现公平的挑战,从而满足了负责任的洗钱的需要。具体而言,它作出了以下贡献。首先,我们处理了群体公平文献中的一个关键假设,即种族和性别等敏感的人口特征是预先已知的,并且可以很容易地用于模型训练以减轻不公平。实际上,隐私和监管等因素常常禁止ML模型在决策中收集或使用受保护的属性。为了应对这一挑战,我们引入了计算可识别错误的新概念,并提出了对抗性加权学习(ARL),这是一种优化方法,旨在提高未观察组的最坏情况性能,而无需访问数据集中的受保护属性。第二,我们认为,虽然群体公平概念是一个理想的公平标准,但由于它们将公平性降低到预先确定的受保护群体的平均统计值,因此它们从根本上受到了限制。实际上,自动决策是在个人层面上做出的,无论小组统计数据如何,都会对个人产生不利影响。我们通过提出iFair(个体公平表示)来推进个体公平的范式,iFair是一种学习数据低维潜在表示的优化方法,有两个目标:尽可能对数据进行编码,同时删除转换表示中有关受保护属性的任何信息。第三,我们提出了个人公平范式,它要求相似的个人获得相似的结果。然而,在观察到的特征空间上计算的相似性度量可能很脆弱,并且在准确捕获个体之间的相似性方面存在固有的局限性。为了解决这个问题,我们引入了公平图的一个新概念,其中可以将成对的个体识别为与ML目标相似。我们将个体公平问题引入到图嵌入中,并提出了PFR(成对公平表示),这是一种学习数据的统一成对公平表示的方法。第四,我们解决了模型部署后生产数据不断演变的挑战。因此,尽管在训练公平模型方面付出了最大努力,ML系统仍可能由于各种不可预见的原因而容易出现故障风险。为了确保负责任的模型部署,需要预测潜在的故障风险,并设计缓解措施,例如,在不确定的情况下听从人类专家的意见,或收集额外的数据来解决模型的盲点。我们建议风险顾问(Risk Advisor),这是一个模型认知元学习者,通过利用随机和认知不确定性的信息理论概念,预测潜在的故障风险,并对导致风险的不确定性来源提供指导。本文通过开发解决关键实际挑战的方法,使ML公平性更接近实际应用。对各种真实世界和合成数据集的大量实验表明,我们提出的方法在实践中是可行的。
导出
BibTeX公司
@phdthesis{Lahotophd2022,TITLE={为负责任的机器学习操作公平性},作者={Lahoti,Preethi},语言={eng},URL={nbn:de:bsz:291--ds-365860},DOI={10.22028/D291-36586},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={作为机器学习(ML)越来越多地用于影响人类的场景中的决策,人们越来越意识到其潜在的不公平性。最近的大量工作集中于提出ML中的正式公平概念,以及减轻不公平的方法。然而,洗钱公平文献与实际操作公平的需要之间的脱节越来越严重。本论文通过开发新的模型和方法来解决在实践中实现公平的挑战,从而满足了负责任的洗钱的需要。具体来说,它做出了以下贡献。首先,我们处理了群体公平文献中的一个关键假设,即种族和性别等敏感的人口特征是预先已知的,并且可以很容易地用于模型训练以减轻不公平。实际上,隐私和监管等因素常常禁止ML模型在决策中收集或使用受保护的属性。为了应对这一挑战,我们引入了计算可识别错误的新概念,并提出了对抗性加权学习(ARL),这是一种优化方法,旨在提高未观察组的最坏情况性能,而无需访问数据集中的受保护属性。第二,我们认为,虽然群体公平概念是一个理想的公平标准,但由于它们将公平性降低到预先确定的受保护群体的平均统计值,因此它们从根本上受到了限制。实际上,自动决策是在个人层面上做出的,无论小组统计数据如何,都会对个人产生不利影响。我们通过提出iFair(个体公平表示)来推进个体公平的范式,iFair是一种学习数据低维潜在表示的优化方法,有两个目标:尽可能对数据进行编码,同时删除转换表示中有关受保护属性的任何信息。第三,我们提出了个人公平范式,这要求相似的个人获得相似的结果。然而,在观察到的特征空间上计算的相似性度量可能很脆弱,并且在准确捕获个体之间的相似性方面存在固有的局限性。为了解决这个问题,我们引入了公平图的一个新概念,其中可以将成对的个体识别为与ML目标相似。我们将个体公平性问题转化为图嵌入问题,并提出了PFR(pairwise fair representation),这是一种学习数据的统一成对公平表示的方法。第四,我们解决了模型部署后生产数据不断演变的挑战。因此,尽管在训练公平模型方面付出了最大努力,ML系统仍可能由于各种不可预见的原因而容易出现故障风险。为了确保进行负责任的模型部署,需要预测潜在的故障风险,并设计缓解措施,例如,在不确定的情况下听从人类专家的意见,或收集额外的数据来解决模型{\textquoteright}的盲点。我们建议风险顾问(Risk Advisor),这是一个模型认知元学习者,通过利用随机和认知不确定性的信息理论概念,预测潜在的故障风险,并对导致风险的不确定性来源提供指导。本文通过开发解决关键实际挑战的方法,使ML公平性更接近实际应用。对各种真实世界和合成数据集的大量实验表明,我们提出的方法在实践中是可行的。},}
尾注
%0论文%普雷西·拉霍蒂%Y Weikum,格哈德%裁判:格马迪,克里希纳%+数据库和信息系统、信息学MPI、马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会Group K.Gummadi,Max Planck Society马克斯普朗克软件系统研究所%T运营公平负责任的机器学习:%G工程%U型http://hdl.handle.net/21.11116/0000-000A-CEC6-F%10.22028/D291-36586兰特%电话号码:de:bsz:291--ds-365860%F其他:高密度脂蛋白:20.500.11880/33465%I大学&#228;萨朗德斯%C Saarbr&#252;科恩%D 2022年%第129页。%V博士%9博士%X随着机器学习(ML)越来越多地用于影响人类的场景中的决策,人们越来越意识到其潜在的不公平性。最近的大量工作集中于提出ML中的正式公平概念,以及减轻不公平的方法。然而,洗钱公平文献与实际操作公平的需要之间的脱节越来越严重。本论文通过开发新的模型和方法来解决在实践中实现公平的挑战,从而满足了负责任的洗钱的需要。具体来说,它做出了以下贡献。首先,我们处理了群体公平文献中的一个关键假设,即种族和性别等敏感的人口特征是预先已知的,并且可以很容易地用于模型训练以减轻不公平。实际上,隐私和监管等因素常常禁止ML模型在决策中收集或使用受保护的属性。为了应对这一挑战,我们引入了计算上可识别错误的新概念,并提出了对抗性加权学习(ARL),这是一种优化方法,旨在提高未观察到的组的最坏情况性能,而不需要访问数据集中受保护的属性。第二,我们认为,虽然群体公平概念是一个理想的公平标准,但由于它们将公平性降低到预先确定的受保护群体的平均统计值,因此它们从根本上受到了限制。实际上,自动决策是在个人层面上做出的,无论小组统计数据如何,都会对个人产生不利影响。我们通过提出iFair(个体公平表示)来推进个体公平的范式,iFair是一种学习数据低维潜在表示的优化方法,有两个目标:尽可能对数据进行编码,同时删除转换表示中有关受保护属性的任何信息。第三,我们提出了个人公平范式,它要求相似的个人获得相似的结果。然而,在观察到的特征空间上计算的相似性度量可能很脆弱,并且在准确捕获个体之间的相似性方面存在固有的局限性。为了解决这个问题,我们引入了公平图的一个新概念,其中可以将成对的个体识别为与ML目标相似。我们将个体公平性问题转化为图嵌入问题,并提出了PFR(pairwise fair representation),这是一种学习数据的统一成对公平表示的方法。第四,我们解决了模型部署后生产数据不断演变的挑战。因此,尽管在训练公平模型方面付出了最大努力,ML系统仍可能由于各种不可预见的原因而容易出现故障风险。为了确保负责任的模型部署,需要预测潜在的故障风险,并制定缓解措施,例如,在不确定时听从人类专家的意见,或收集额外的数据来解决模型问题;的盲点。我们建议风险顾问(Risk Advisor),这是一个模型认知元学习者,通过利用随机和认知不确定性的信息理论概念,预测潜在的故障风险,并对导致风险的不确定性来源提供指导。本文通过开发解决关键实际挑战的方法,使ML公平性更接近实际应用。对各种真实世界和合成数据集的大量实验表明,我们提出的方法在实践中是可行的。%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/33465
[10]
A.Nusser,“几何相似性度量的细粒度复杂性和算法工程”,萨尔兰德斯大学,萨尔布吕肯,2022年。
导出
BibTeX公司
@ph值{NusserPhD22,TITLE={几何相似度量的细粒度复杂性和算法工程},作者={Nusser,Andr{\'e}},语言={eng},URL={urn:nbn:de:bsz:291--ds-370184},DOI={10.22028/D291-37018},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},}
尾注
%0论文%A Nusser,安德烈&#233;%Y Bringmann,卡尔%裁判:梅尔霍恩,库尔特%裁判:陈,蒂莫西%裁判:德贝尔,马克%+算法与复杂性,信息学MPI,马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会算法与复杂性,信息学MPI,马克斯·普朗克学会算法与复杂性,信息学MPI,马克斯·普朗克学会外部组织外部组织%T细粒度复杂性和几何相似性度量的算法工程:%G工程%U型http://hdl.handle.net/21.11116/0000-000C-2693-3%10.22028/D291-37018兰特%图:nbn:de:bsz:291--ds-370184%其他:hdl:20.500.11880/33904%I大学&#228;萨朗德斯%C Saarbr&#252;科恩%D 2022年%第十四页,第210页。%电压phd%9博士%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/33904
[11]
D.Stutz,“理解和改进深度学习中的稳健性和不确定性评估”,萨尔兰德大学,萨尔布吕肯,2022年。
摘要
深度学习在许多高风险应用中变得越来越重要,例如自动驾驶或医疗诊断,在这些应用中,错误的决策可能会对人类生活产生巨大影响。不幸的是,深度神经网络通常仅基于泛化进行评估,例如,在固定测试集上的准确性。然而,这显然不足以实现安全部署,因为潜在的恶意参与者和分布发生了变化,或者忽略了量化和不可靠硬件的影响。因此,最近的工作额外评估了潜在操纵或损坏输入的性能,以及量化和在专用硬件上部署后的性能。在这种情况下,获得模型置信度的合理估计及其预测也很重要。本文主要从三个方向研究深度学习中的鲁棒性和不确定性估计:首先,我们考虑所谓的对抗性示例,轻微扰动的输入会导致精度严重下降。其次,我们研究权重扰动,特别关注量化权重中的比特误差。这与在用于高效推理的专用硬件(即所谓的加速器)上部署模型有关。最后,我们处理不确定性估计,以提高鲁棒性,并为安全部署提供有意义的统计性能保证。详细地,我们研究了关于底层数据流形的对抗性示例的存在性。在这种情况下,我们还研究了对抗训练,它通过以降低准确性为代价,用对抗示例增强训练来提高鲁棒性。我们表明,常规对抗性示例使数据流形几乎正交。虽然我们发现健壮性和准确性之间没有内在的权衡,但这导致了更高的样本复杂度以及对抗训练的严重过拟合。使用关于权重变化的鲁棒损失图中平面度的新度量,我们还表明鲁棒过拟合是由收敛到特别尖锐的最小值引起的。事实上,我们发现平坦度和良好的鲁棒泛化之间存在明显的相关性。此外,我们还研究了量化权重中的随机和对抗性比特错误。在加速器中,为了提高能效而降低电压时,存储器中会发生随机比特错误。在这里,我们考虑一种稳健的量化方案,使用权重剪裁作为正则化,并执行随机误码训练以提高误码鲁棒性,从而在不需要硬件更改的情况下节省大量能量。相反,恶意的比特错误是通过基于硬件或软件的内存攻击恶意引入的,会严重影响性能。我们提出了一种新的对抗性误码攻击来研究这种威胁,并使用对抗性的误码训练来提高鲁棒性,从而提高加速器的安全性。最后,我们在不确定性估计的背景下看待稳健性。通过鼓励对对抗性示例进行低置信度预测,我们的信任校准对抗性训练在测试时成功地拒绝了对抗性示例、腐败示例和分发外示例。因此,与常规对抗性训练相比,我们还能够提高鲁棒性和准确性的权衡。然而,即使是健壮的模型也不能为安全部署提供任何保证。为了解决这个问题,保角预测允许模型预测置信集,并保证包含真实标签。不幸的是,由于保角预测通常是在训练后应用的,所以训练模型时没有考虑这个校准步骤。为了解决这个局限性,我们提出了保角训练,它允许使用底层模型端到端地训练保角预测因子。这不仅提高了获得的不确定性估计值,还可以优化特定应用的目标,而不会失去所提供的保证。除了我们在稳健性或不确定性方面的工作外,我们还解决了部分观测点云的3D形状完成问题。具体来说,我们认为,在自动驾驶或机器人设置中,车辆通常配备激光雷达或深度传感器,获得完整的环境3D表示至关重要。然而,应用深度学习技术所必需的基本事实形状极难获得。因此,我们提出了一种弱监督方法,可以在不完整的点云上进行训练,同时提供有效的推理。总之,本文有助于我们理解对输入和权重扰动的鲁棒性。为此,我们还开发了提高稳健性的方法以及不确定性估计,以便在高风险应用中安全部署深度学习方法。在自动驾驶的特定背景下,我们还讨论稀疏点云的3D形状完成。
导出
BibTeX公司
@博士学位{Stutzphd2022,TITLE={理解和改进深度学习中的稳健性和不确定性估计},作者={Stutz,David},语言={eng},URL={nbn:de:bsz:291--ds-372867},DOI={10.22028/D291-37286},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={深度学习越来越适用于许多高风险的应用,如自动驾驶或医疗诊断,在这些应用中,错误的决策可能会对人类生活产生巨大影响。不幸的是,深度神经网络通常只基于泛化来评估,例如,在固定测试集上的准确性。然而,这显然是不正确的有效地进行安全部署,因为潜在的恶意行为体和分布转移或量化和不可靠硬件的影响被忽略。因此,最近的工作额外评估了潜在操纵或损坏输入的性能,以及量化和在专用硬件上部署后的性能。在这种情况下,获得模型置信度的合理估计及其预测也很重要。本文主要从三个方向研究深度学习中的鲁棒性和不确定性估计:首先,我们考虑所谓的对抗性示例,轻微扰动的输入会导致精度严重下降。其次,我们研究权重扰动,特别关注量化权重中的比特误差。这与在专用硬件上部署模型以实现高效推理有关,即所谓的加速器。最后,我们处理不确定性估计,以提高鲁棒性,并为安全部署提供有意义的统计性能保证。详细地,我们研究了关于底层数据流形的对抗性示例的存在性。在这种情况下,我们还研究了对抗训练,它通过以降低准确性为代价,用对抗示例增强训练来提高鲁棒性。我们表明,常规对抗性示例使数据流形几乎正交。虽然我们发现健壮性和准确性之间没有内在的权衡,但这导致了更高的样本复杂度以及对抗训练的严重过拟合。使用关于权重变化的鲁棒损失图中平面度的新度量,我们还表明鲁棒过拟合是由收敛到特别尖锐的最小值引起的。事实上,我们发现平坦度和良好的鲁棒泛化之间存在明显的相关性。此外,我们还研究了量化权重中的随机和对抗性比特错误。在加速器中,当以提高能源效率为目标降低电压时,存储器中会出现随机位错误。在这里,我们考虑一种稳健的量化方案,使用权重剪裁作为正则化,并执行随机误码训练以提高误码鲁棒性,从而在不需要硬件更改的情况下节省大量能量。相反,恶意的比特错误是通过基于硬件或软件的内存攻击恶意引入的,会严重影响性能。我们提出了一种新的对抗性误码攻击来研究这种威胁,并使用对抗性的误码训练来提高鲁棒性,从而提高加速器的安全性。最后,我们在不确定性估计的背景下看待稳健性。通过鼓励对对抗性示例进行低置信度预测,我们的信任校准对抗性训练在测试时成功地拒绝了对抗性示例、腐败示例和分发外示例。因此,与常规对抗训练相比,我们还能够改进鲁棒性与准确性之间的权衡。然而,即使是健壮的模型也不能为安全部署提供任何保证。为了解决这个问题,保角预测允许模型预测置信集,并保证包含真实标签。不幸的是,由于保角预测通常是在训练后应用的,所以训练模型时没有考虑这个校准步骤。为了解决这一限制,我们提出了保形训练,它允许使用底层模型端到端地训练保形预测因子。这不仅提高了获得的不确定性估计值,还可以优化特定应用的目标,而不会失去所提供的保证。除了我们在稳健性或不确定性方面的工作外,我们还解决了部分观测点云的3D形状完成问题。具体来说,我们认为,在自动驾驶或机器人设置中,车辆通常配备激光雷达或深度传感器,获得完整的环境3D表示至关重要。然而,应用深度学习技术所必需的基本事实形状极难获得。因此,我们提出了一种弱监督方法,可以在不完整的点云上进行训练,同时提供有效的推理。总之,本文有助于我们理解对输入和权重扰动的鲁棒性。为此,我们还开发了提高稳健性的方法以及不确定性估计,以便在高风险应用中安全部署深度学习方法。在自动驾驶的特定背景下,我们还讨论稀疏点云的3D形状完成。},}
尾注
%0论文%A Stutz,大卫%Y Schiele,伯恩特%裁判:Hein,Matthias%裁判:Kumar,Pawan%裁判:弗里茨,马里奥%+计算机视觉和机器学习,信息学MPI,马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会计算机视觉和机器学习,信息学MPI,马克斯·普朗克学会外部组织外部组织计算机视觉和机器学习,信息学MPI,马克斯·普朗克学会%T理解和提高健壮性深度学习中的不确定性评估:%G工程%U型http://hdl.handle.net/21.11116/0000-000B-3FE6-C%10.22028/D291-37286兰特%电话号码:de:bsz:291--ds-372867%其他:hdl:20.500.11880/33949%I大学&#228;萨朗德斯%C Saarbr&#252;克肯%D 2022年%P 291页。%V博士%9博士%X深度学习在许多高风险应用中变得越来越重要,例如自动驾驶或医疗诊断,在这些应用中,错误的决策可能会对人类生活产生巨大影响。不幸的是,深度神经网络通常仅基于泛化进行评估,例如,在固定测试集上的准确性。然而,这显然不足以实现安全部署,因为潜在的恶意参与者和分布发生了变化,或者忽略了量化和不可靠硬件的影响。因此,最近的工作额外评估了潜在操纵或损坏输入的性能,以及量化和在专用硬件上部署后的性能。在这种情况下,获得模型置信度的合理估计及其预测也很重要。本文主要从三个方向研究深度学习中的鲁棒性和不确定性估计:首先,我们考虑所谓的对抗性示例,轻微扰动的输入会导致精度严重下降。其次,我们研究权重扰动,特别关注量化权重中的比特误差。这与在专用硬件上部署模型以实现高效推理有关,即所谓的加速器。最后,我们处理不确定性估计,以提高鲁棒性,并为安全部署提供有意义的统计性能保证。详细地,我们研究了关于底层数据流形的对抗性示例的存在性。在这种情况下,我们还研究了对抗训练,它通过以降低准确性为代价,用对抗示例增强训练来提高鲁棒性。我们表明,常规对抗性示例使数据流形几乎正交。虽然我们发现健壮性和准确性之间没有内在的权衡,但这导致了更高的样本复杂度以及对抗训练的严重过拟合。使用关于权重变化的鲁棒损失图中平面度的新度量,我们还表明鲁棒过拟合是由收敛到特别尖锐的最小值引起的。事实上,我们发现平坦度和良好的鲁棒泛化之间存在明显的相关性。此外,我们还研究了量化权重中的随机和对抗性比特错误。在加速器中,为了提高能效而降低电压时,存储器中会发生随机比特错误。在这里,我们考虑一种稳健的量化方案,使用权重剪裁作为正则化,并执行随机误码训练以提高误码鲁棒性,从而在不需要硬件更改的情况下节省大量能量。相反,恶意的比特错误是通过基于硬件或软件的内存攻击恶意引入的,会严重影响性能。我们提出了一种新的对抗性误码攻击来研究这种威胁,并使用对抗性误码训练来提高鲁棒性,从而提高加速器的安全性。最后,我们在不确定性估计的背景下看待稳健性。通过鼓励对对抗性示例进行低置信度预测,我们的信任校准对抗性训练在测试时成功地拒绝了对抗性示例、腐败示例和分发外示例。因此,与常规对抗训练相比,我们还能够改进鲁棒性与准确性之间的权衡。然而,即使是健壮的模型也不能为安全部署提供任何保证。为了解决这个问题,保角预测允许模型预测置信集,并保证包含真实标签。不幸的是,由于保角预测通常是在训练后应用的,所以训练模型时没有考虑这个校准步骤。为了解决这个局限性,我们提出了保角训练,它允许使用底层模型端到端地训练保角预测因子。这不仅提高了获得的不确定性估计值,还可以优化特定应用的目标,而不会失去所提供的保证。除了我们在稳健性或不确定性方面的工作外,我们还解决了部分观测点云的3D形状完成问题。具体来说,我们认为,在自动驾驶或机器人设置中,车辆通常配备激光雷达或深度传感器,获得完整的环境3D表示至关重要。然而,应用深度学习技术所必需的基本事实形状极难获得。因此,我们提出了一种弱监督方法,可以在不完整的点云上进行训练,同时提供有效的推理。总之,本文有助于我们理解对输入和权重扰动的鲁棒性。为此,我们还开发了提高稳健性的方法以及不确定性估计,以便在高风险应用中安全部署深度学习方法。在自动驾驶的特定背景下,我们还解决了稀疏点云的3D形状完成问题。%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/33949
[12]
A.Tigunova,“从对话中提取个人信息”,萨尔兰大学,萨尔布吕肯,2022年。
摘要
个人知识是一种多用途的资源,对广泛的下游应用程序很有价值。关于用户的背景信息可以让聊天机器人助理产生更多的主题性和移情性回复。在推荐和检索模型的上下文中,可以使用个人事实为个人用户定制排名结果。个人知识库包含个人事实,如人口统计信息、兴趣和人际关系,是存储和查询个人知识的唯一端点。此类知识库易于解释,可以为用户提供对其个人知识的完全控制,包括修改存储的事实和管理下游服务的访问,以实现个性化。为了减轻用户建立此类个人知识库的大量手动工作,我们可以利用应用于用户文本内容的自动提取方法,如对话记录或社交媒体帖子。主流提取方法专门针对结构良好的数据,如传记文本或百科全书文章,这对大多数人来说都是罕见的。反过来,会话数据丰富,但处理起来很有挑战性,需要专门的方法来提取个人事实。在本论文中,我们讨论了从会话数据中获取个人知识。我们提出了几种新的深度学习模型来推断说话人的个人属性:•人口统计属性、年龄、性别、职业和家庭地位,这些都是由具有注意机制的HAM层次神经分类器推断出来的。经过训练的HAM可以在不同类型的对话数据之间传输,并提供可解释的预测CHARM是一种零快照学习模型,它可以预测长期的个人属性、爱好和职业,从而克服了缺乏针对罕见属性值的标记训练样本的问题。通过将对话话语与外部来源联系起来,CHARM能够预测训练期间从未见过的属性值人际关系是通过PRIDE(基于等级变换器的模型)推断出来的。为了准确预测细粒度的关系,PRIDE利用了说话人的个人特征和对话的风格。对各种对话文本的实验,包括Reddit讨论和电影脚本,证明了我们的方法的可行性以及与最先进的基线相比的优越性能。
导出
BibTeX公司
@phdthesis{Tiguphd2022,TITLE={从对话中提取个人信息},作者={蒂古诺娃,安娜},语言={eng},URL={nbn:de:bsz:291--ds-356280},DOI={10.22028/D291-35628},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={个人知识是一种多用途的资源,对广泛的下游应用程序很有价值。有关用户的背景信息可以让聊天机器人助理生成更多的主题和同理心回复。在推荐和检索模型的上下文中,个人信息可以用于为个人用户自定义排名结果Personal Knowledge Base是存储和查询个人知识的唯一端点,其中包含个人事实,如人口统计信息、兴趣和人际关系。此类知识库易于解释,可以为用户提供对其个人知识的完全控制,包括修改存储的事实和管理下游服务的访问,以实现个性化。为了减轻用户构建此类个人知识库的大量手动工作,我们可以利用应用于用户文本内容的自动提取方法,例如对话记录或社交媒体帖子。主流提取方法专门针对结构良好的数据,如传记文本或百科全书文章,这对大多数人来说都是罕见的。反过来,会话数据丰富,但处理起来很有挑战性,需要专门的方法来提取个人事实。在本论文中,我们讨论了从会话数据中获取个人知识。我们提出了几种新的深度学习模型来推断说话者的个人属性:通过具有注意机制的层次神经分类器HAMs来推断人口统计属性,如年龄、性别、职业和家庭状况。经过训练的HAM可以在不同类型的会话数据之间传输,并提供可解释的预测。\mbox{$\bullet$}使用CHARM(一种零快照学习模型)预测了长期的个人属性、爱好和职业,克服了缺乏针对罕见属性值的标记训练样本的问题。通过将对话话语与外部来源联系起来,CHARM能够预测训练期间从未见过的属性值。\mbox{$\bullet$}人际关系是通过PRIDE(一种基于层次变换器的模型)推断出来的。为了准确预测细粒度的关系,PRIDE利用了说话人的个人特征和对话的风格。对各种对话文本的实验,包括Reddit讨论和电影脚本,证明了我们的方法的可行性以及与最新基线相比的优越性能。},}
尾注
%0论文%安娜·蒂古诺娃%Y Weikum,格哈德%裁判:耶茨,安德鲁%裁判:Demberg,Vera%+数据库和信息系统、信息学MPI、马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会数据库和信息系统、信息学MPI、马克斯·普朗克学会外部组织%T从中提取个人信息对话:%G工程%U型http://hdl.handle.net/21.11116/0000-000B-3FE1-1%10.22028/D291-35628兰特%电话号码:de:bsz:291--ds-356280%其他:hdl:20.500.11880/32546%I大学&#228;萨尔州%C Saarbr&#252;科恩%D 2022年%第139页。%V博士%9博士%X个人知识是一种多用途的资源,对广泛的下游应用程序很有价值。关于用户的背景信息可以让聊天机器人助理产生更多的主题性和移情性回复。在推荐和检索模型的上下文中,可以使用个人事实为个人用户定制排名结果。个人知识库包含个人事实,如人口统计信息、兴趣和人际关系,是存储和查询个人知识的唯一端点。此类知识库易于解释,可以为用户提供对其个人知识的完全控制,包括修改存储的事实和管理下游服务的访问,以实现个性化。为了减轻用户构建此类个人知识库的大量手动工作,我们可以利用应用于用户文本内容的自动提取方法,例如对话记录或社交媒体帖子。主流提取方法专门针对结构良好的数据,如传记文本或百科全书文章,这对大多数人来说都是罕见的。反过来,会话数据丰富但难以处理,并且需要专门的方法来提取个人事实。在本论文中,我们讨论了从会话数据中获取个人知识。我们提出了几种新的深度学习模型,用于推断说话者;个人属性:&#8226;采用具有注意机制的层次化神经分类器HAM来推断人口统计属性、年龄、性别、职业和家庭状况。经过训练的HAM可以在不同类型的会话数据之间传输,并提供可解释的预测&#8226; CHARM是一种零快照学习模型,它可以预测长期的个人属性、爱好和职业,从而克服了缺乏针对罕见属性值的标记训练样本的问题。通过将对话话语与外部来源联系起来,CHARM能够预测训练期间从未见过的属性值&#8226; 人际关系是通过PRIDE(基于等级变换器的模型)推断出来的。为了准确预测细粒度的关系,PRIDE利用了说话人的个人特征和对话的风格。对各种对话文本的实验,包括Reddit讨论和电影剧本,证明了我们的方法的可行性,以及与最先进的基线相比的优越性能。%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/32546
[13]
J.Wang,“使用基于模型的Priors从单眼相机进行三维手部重建”,萨尔布伦大学,2022年。
导出
BibTeX公司
@phdthesis{王家义_PhD2023,TITLE={{3D}基于模型先验的单目相机手部重建},作者={Wang,Jiayi},URL={urn:nbn:de:bsz:291--ds-399055},DOI={10.22028/D291-39905},学校={University{\“a}t des Saarlandes},地址={萨尔布尔{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},}
尾注
%0论文%A Wang、Jiayi%基督教Y Theobalt%裁判:卡萨斯,丹%裁判:Steimle,J&#252;rgen公司%+视觉计算和人工智能,信息学MPI,马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会视觉计算和人工智能,信息学MPI,马克斯·普朗克学会计算机制图、信息学MPI、马克斯·普朗克学会计算机制图、信息学MPI、马克斯·普朗克学会%基于模型先验的单眼相机T 3D手部重建:%U型http://hdl.handle.net/21.11116/0000-000D-7322-B%图:nbn:de:bsz:291--ds-399055%10.22028/D291-39905兰特%F其他:高密度脂蛋白:20.500.11880/36048%I大学&#228;萨朗德斯%C Saarbr&#252;科恩%D 2022年%Pxvi,123便士%V博士%9博士%U型https://scidok.sulb.uni-saarland.de/handle/20.500.11880/36048
[14]
B.Wiederhake,“脉冲传播、图形覆盖和数据包转发”,萨尔兰德大学,萨尔布吕肯,2022年。
摘要
我们研究分布式系统,特别关注图形问题和容错<br>通过使用容错脉冲传播设计,可以提高微处理器甚至系统芯片的容错能力。现有的TRIX设计通过成为由非常简单的节点组成的分布式系统来实现这一目标。我们表明,即使在无故障的典型操作模式下,TRIX的性能也明显优于常规接线或时钟树:模拟实验的统计评估表明,我们实现了标准偏差为O(log log H)的偏差,其中H是TRIX网格的高度。经典图形问题的distance-r泛化可以让我们了解距离如何影响问题的难易程度。对于距离r支配集问题,我们<br>给出了具有某些高围长和稀疏性准则的任何图类<br>的算法上界和无条件下界。特别是,我们的算法在时间O(r)上实现了<br>O(r·f(r))-近似,其中f是与密度相关的展开函数。对于常数r,这意味着以常数<br>时间表示的常数近似因子。我们还证明,对于时间O(r)中任何<br>δ>0的(2r+1−δ)-近似,没有任何算法能够实现,即使是在周长至少为5r的循环类上也是如此。此外,我们将该算法扩展到相关的图覆盖问题,甚至扩展到不同的执行模型<此外,我们研究了数据包转发问题,它解决了如何以及何时在分布式系统中最好地转发数据包的问题。这些数据包<br>由对手注入。我们在现有算法OED的基础上进行构建,以处理比单个目的地更多的<br>。特别地,我们证明了大小为O(log n)的缓冲区对于该算法来说足够<br>,而对于朴素方法来说则足够O(n)。
导出
BibTeX公司
@phdthesis{Wiederhakephd2021,TITLE={脉冲传播、图形覆盖和数据包转发},作者={Wiederhake,Ben},语言={eng},URL={nbn:de:bsz:291--ds-366085},DOI={10.22028/D291-36608},学校={University{\“a}t des Saarlandes},地址={Saarbr{\“u}cken},年份={2022},MARGINALMARK={$\bullet$},日期={2022},摘要={我们研究分布式系统,特别关注图形问题和容错。使用容错脉冲传播设计可以提高微处理器甚至芯片上系统的容错能力。现有设计TRIX通过成为由非常简单的节点组成的分布式系统来实现这一目标即使在无故障的典型操作模式下,TRIX的性能也明显优于常规线路或时钟树:模拟实验的统计评估表明,我们实现了标准偏差为O(log log H)的偏差,其中H是TRIX网格的高度。经典图形问题的distance-r泛化可以让我们了解距离如何影响问题的难易程度。对于距离-r支配集问题,我们<br>为任何具有一定高周长和稀疏性标准的图类<br>提供了算法上界和无条件下界。特别是,我们的算法在时间O(r)上实现了<br>O(r&#183;f(r))-近似,其中f是扩展函数,它与密度相关。对于常数r,这意味着以常数<br>时间表示的常数近似因子。我们还证明,对于时间O(r)中任何<br>$delta$>0的(2r+1{\textminus}$delta$)-近似,没有任何算法能够实现,即使是在周长至少为5r的圈类上也是如此。此外,我们将该算法扩展到相关的图覆盖问题,甚至扩展到不同的执行模型<此外,我们研究了数据包转发问题,它解决了如何以及何时在分布式系统中最好地转发数据包的问题。这些数据包<br>由对手注入。我们基于现有的算法OED来处理比单个目的地更多的<br>。特别地,我们证明了大小为O(log n)的缓冲区对于该算法来说已经足够了,而对于naive方法来说,则是O(n)。},}
尾注
%0论文%A Wiederhake,Ben%克里斯托弗·伦岑%裁判:梅尔霍恩,库尔特%+算法与复杂性,信息学MPI,马克斯·普朗克学会马克斯·普朗克国际研究院,信息学MPI,马克斯·普兰克学会算法与复杂性,信息学MPI,马克斯·普朗克学会算法与复杂性,信息学MPI,马克斯·普朗克学会%T脉冲传播,图形覆盖,和数据包转发:%G工程%U型http://hdl.handle.net/21.11116/0000-000A-CEBE-9%10.22028/D291-36608兰特%电话号码:de:bsz:291--ds-366085%其他:hdl:20.500.11880/33316%I大学&#228;萨尔州%C Saarbr&#252;科恩%D 2022年%第83页。%V博士%9博士%我们研究分布式系统,特别关注图形问题和容错<br>通过使用容错脉冲传播设计,可以提高微处理器甚至系统芯片的容错能力。现有的TRIX设计通过成为由非常简单的节点组成的分布式系统来实现这一目标。我们表明,即使在无故障的典型操作模式下,TRIX的性能也明显优于常规接线或时钟树:模拟实验的统计评估表明,我们实现了标准偏差为O(log log H)的偏差,其中H是TRIX网格的高度。经典图形问题的distance-r泛化可以让我们了解距离如何影响问题的难易程度。对于距离r支配集问题,我们<br>给出了具有某些高围长和稀疏性准则的任何图类<br>的算法上界和无条件下界。特别是,我们的算法在时间O(r)中实现了<br>O(r&#183;f(r))-近似,其中f是与密度相关的展开函数。对于常数r,这意味着以常数<br>时间表示的常数近似因子。我们还表明,对于任何<br>&#948;>,没有任何算法可以实现(2r+1&#8722;&#948)-近似时间O(r)为0,甚至在周长至少为5r的循环类上也不为0。此外,我们<br>将算法扩展到相关的图覆盖问题,甚至扩展到不同的执行<br>模型<此外,我们研究了数据包转发问题,它解决了如何以及何时在分布式系统中最好地转发数据包的问题。这些数据包<br>由对手注入。我们基于现有的算法OED来处理比单个目的地更多的<br>。特别地,我们证明了大小为O(log n)的缓冲区对于该算法来说足够<br>,而对于朴素方法来说则足够O(n)。%U型https://publikationen.sulb.uni-saarland.de/handle/20.500.11880/33316