利用基因表达数据集的先验知识进行综合生物标记检测

综合生物标记-Erkenung-auf基因表达-Daten mithilfe von biologischem Vorwissen

  • 对基因表达数据进行分析,以确定用于诊断、预测或预后的生物标记,例如相关基因。传统的生物标记物检测方法仅基于其中的信号从数据中选择独特的特征,面临着过度拟合、生物标记物稳健性和实际生物相关性方面的多重缺陷。通过将先前的生物知识(例如关于基因-疾病关联的知识)纳入实际分析中,预期先验知识方法可以解决这些问题。然而,先验知识方法目前在实践中并没有得到广泛应用,因为它们通常是针对特定用途的,很少适用于不同的范围。这导致以往知识方法缺乏可比性,这反过来又使目前无法在更广泛的背景下评估其有效性。我们的工作通过三项贡献解决了上述问题。我们的第一份贡献为先前的知识和灵活的对基因表达数据进行分析,以确定用于诊断、预测或预后的生物标记,例如相关基因。传统的生物标记物检测方法仅基于其中的信号从数据中选择独特的特征,面临着过度拟合、生物标记物稳健性和实际生物相关性方面的多重缺陷。通过将先前的生物知识(例如关于基因-疾病关联的知识)纳入实际分析中,预期先验知识方法可以解决这些问题。然而,先验知识方法目前在实践中并没有得到广泛应用,因为它们通常是针对特定用途的,很少适用于不同的范围。这导致先前知识方法缺乏可比性,这反过来又使得目前无法在更广泛的背景下评估其有效性。我们的工作通过三项贡献解决了上述问题。我们的第一份贡献为先验知识及其在特征选择过程中的灵活集成提供了形式化定义。这些概念的核心是从在线知识库中自动检索先验知识,从而简化检索过程并就先验知识的统一定义达成一致。我们随后描述了新的和广义的先验知识方法,这些方法对于所使用的先验信息是灵活的,并且适用于不同的用例域。我们的第二个贡献是基准平台Comporior。Compior在实践中应用了上述概念,并允许灵活地建立全面的基准研究,以检查现有和新的先验知识方法的性能。它简化了对先验知识的检索,并允许将其与先验知识方法相结合。Comporior证明了我们的概念的实际适用性,并进一步促进了先前知识方法的全面发展和可比性。我们的第三个贡献是对先验知识方法有效性的综合案例研究。为此,我们使用Compior并测试了一系列传统和先验知识方法,以及基于多个疾病领域数据集的多个知识库。最终,我们的案例研究对a)所选知识库对集成的适用性,b)在不同集成级别应用先验知识的影响,以及c)分类性能、生物相关性和整体稳健性方面的改进进行了全面评估。总之,我们的贡献表明,先验知识的广义概念和简化的检索过程提高了先验知识方法的适用性。我们的案例研究结果表明,整合先验知识会积极影响生物标记结果,尤其是其稳健性。我们的发现首次深入了解了先前知识方法的有效性,并为未来的研究奠定了宝贵的基础。显示更多显示较少
  • 生物标记sind characteristische biologische Merkmale mit diagnostischer oder prognostische Aussagekraft。Auf der molekularen Ebene sind dies Gene mit einem krankheitsspezifischen Expressionsmuster,welche mittels der Analyse von Genexpressionsdaten identifiziert werden。Traditelle Ansätze für diese Art von Biomarker Detection wählen Gene als Biomarker-ausschließlich anhand der vorhandenen Signale im Datensatz aus。Vorgehensweise zeigt jedoch Schwächen insbesondere in Bezug auf die Robustheit and tatsächliche biologische Relevanz der identifiezerten Biomarker在生物标志物识别方面发挥了重要作用。Verschiedene Forschungsarbeiten legen nahe,dass die Berücksichtigung des biologischen Kontexts während des Selektionsprozesses diese Schwächen ausgleichen kann。Sogenannte wissensbasierte Ansätze für生物标记物检测beziehen vorhandenes biologisches Wissen,beispelsweiseüber Zusammenhänge zwischen bestimmten Genen und Krankheiten,direct in die Analyse mit ein。Die Anwendung solcher Verfahren is in der Praxis jedoch derzeit nicht weit verbreitet,da公司生物标记sind characteristische biologische Merkmale mit diagnostischer oder prognostische Aussagekraft。Auf der molekularen Ebene sind dies Gene mit einem krankheitsspezifischen Expressionsmuster,welche mittels der Analyse von Genexpressionsdaten identifiziert werden。Traditelle Ansätze für diese Art von Biomarker Detection wählen Gene als Biomarker-ausschließlich anhand der vorhandenen Signale im Datensatz aus。Diese Vorgehensweise zeigt jedoch Schwächen insbesondere in Bezug auf die Robustheit und tatsächliche biologische Relevanz der identifizierten Biomarker公司。Verschiedene Forschungsarbeiten legen nahe,dass die Berücksichtigung des biologischen Kontexts während des Selektionsprozesses diese Schwächen ausgleichen kann。Sogenannte wissensbasierte Ansätze für生物标记物检测beziehen vorhandenes biologisches Wissen,beispelsweiseüber Zusammenhänge zwischen bestimmten Genen und Krankheiten,direct in die Analyse mit ein。Die Anwendung solcher Verfahren is in der Praxis jedoch derzeit nicht weit verbreittet,da-existerende Methoden of spezifischür einen best immtten Anwendengsfall entwicket wurden und sich nur mit großem Aufwand auf andere Anwentungsgebebeieteübertragen lassen。Dadurch sind Vergleich untereinander kaum möglich,在einem breiteren Kontext zu untersuchen是一个名为Effektivität von wissensbasierten Methoden的组织。阿贝特将接过这场比赛。在einem ersten Schritt legen wir formale und einheitlich Definitionen für vorhandenes biologisches Wissen sowie ihe生物标记与Auswahlprozess fest的灵活整合中。科尔格丹克解封Ansatzes is die automatisete Beschaffung von biologischem Wissen aus im Internet frei verfügbaren Wissens-Datenbanken。Dies erlaubt eine Vereinfachung der Kuratierung sowie die Festlegung einer einheitlichen定义für biologisches Wissen。Darauf aufbauend beschreiben wir generalisiete wissensbasierte Verfahren,welche flexibel auf verschiedene Anwendungsfalle anwendbar sind。在einem zweiten Schritt haben wir die Benchmarking Plattform Composior entwicket中,welche在einer praktischen Anwendung实现者中揭开了Konzepte的理论。国会议员埃莫·格利赫特·迪·施奈尔·乌姆塞特祖·冯·乌姆凡格里钦实验(Vergleich von wissensbasierten Ansätzen)。威斯森和埃尔莫格列希特议员表示,他们是威斯森巴西尔滕·安萨岑(wissensbasierten Ansätzen)的议员。在现实主义和Vergleichbarkeit技术的基础上,我们将对Umsetzbarkeit进行实践。在Efektivität wissensbasierter Ansätze im Rahmen einer umfangreichen Fallstudie的埃因姆德雷滕·施里特(Efemt dritten Schritt untertsuchen)。Mithilfe von Compior vergleichen wir die Ergebnisse traditioneller und wissensbasierter Ansätze im Kontext verschiedener Krankheiten,wobei wir für wissensbasierte Ansátze auch verschiedne Wissens-Datenbanken verwenden。Unsere Fallstudie untersucht damit a)die Eignung von ausgewählten Wissens-Datenbanken für deren Einsatz bei wissensbasierten Ansätzen,b)den Einfluss verschiedener Integrationskonzepte für-biologisches Wissen auf den Biomarker-Aswahlprozess,und c)den Grad der Verbezug auf die Klassifikationsleistung,biologische Relevanz und allgemeine Robustheit der selektierten生物标记物。Zusammenfassend demonstriert unsere Arbeit,dass generalisiete Konzepte für biologisches Wissen und dessen vereinfachte Kuration die praktische Anwendbarkeit von wissensbasierten Ansätzen erleichtern。Die Ergebnisse unser Fallstudie zeigen,dass Die Integration von vorhandenem biologischen Wissen einen positiven Einfluss auf Die selektierten Biomarker hat,insbessene in Bezug auf ihre biologisch Relevanz。Diese erstmals umfassendern Erkentnisse zur Effektivittät von wissensbasierten Ansätzen bilden eine wertvolle Grundlage für zuk nftige Forschungsarbeiten。显示更多显示较少

下载全文文件

  • 个人签名.pdf电子工程师
    (30781KB)

    SHA-512:d03a273b8a9dcaffd38b5eb341f51d38df4c5e965c91957d3bec45dbfedd82db32ac55895a3e1951e87770c7ceee2dc3703062b0f11aec35aa6205c73b8c6

Metadaten公司
作者详细信息:辛迪·佩尔切伊德ORCiD公司接地
URN:urn:nbn:de:kobv:517-opus4-582418
内政部:https://doi.org/10.25932/publishup-58241
审核人:伯恩哈德·雷纳德ORCiD公司接地,扬·鲍姆巴赫ORCiD公司,卡洛斯·安德烈斯·佩尼亚
主管:Christoph Lippert,Bernhard Y.Renard
出版物类型:博士论文
语言:英语
出版年份:2023
出版机构:波茨坦大学
授予机构:波茨坦大学
期末考试日期:2023/02/14
发布日期:2023/03/30
标签:生物标记-Erkenung;基因表达;Merkmalsauswahl公司;生物学沃维森
生物标志物检测;特征选择;基因表达;先验知识
页数:九、197
RVK-雷根斯堡分类:第640页、第600页、第302页
组织单位:数字工程Fakultät/Hasso-Plattner-Institute für Digital Engineering GmbH
CCS分类:D.软件
H.信息系统
J.计算机应用
DDC分类:0 Informatik、Informationswissenschaft、allgemeine Werke/00 Informatick、Wissen、Systeme/000 Informatik,Informationswissenschaft、allgemene Werke
5 Naturwissenschaften und Mathematik/57 Biowissenschaften;Biologie/570 Biowissenschaften;生物学
6 Technik,Medizin,angewandte Wissenschaften/60 Technik/600 Technik、Technologie
MSC分类:62-XX统计
68-XX计算机科学(有关特定数学领域中涉及机器计算和程序的论文,请参阅该领域的第{04节68-00一般参考书(手册、字典、参考书目等)
许可证(德语):许可证徽标CC-BY-Namensnennung 4.0国际
接受
本网站使用技术上必要的会话Cookie。继续使用该网站即表示您同意这一点。你可以在这里找到我们的隐私政策。