自动化知识库构建

本次高级讲座的重点是如何使用信息提取技术构建知识库。主题将是使用模式的自动信息提取、监督提取器和开放信息提取、信息框爬行、实体消歧和规范化、知识库学习及其在问答中的应用。我们还将涉及众包知识库的构建、评估措施、,以及最先进的知识库。在教程中,参与者将实现选定的主题。共有8份家庭作业,其中6份需要通过考试


概述

类型高级讲座,住院
信用6个ECTS
日期2022年夏季学期
时间周三12:15-13:45(讲座),16:15-17:45(辅导)
教师西蒙·拉兹涅夫斯基(演讲)、希巴·阿尔诺(Hiba Arnaout)、什雷斯塔·戈什(Shrestha Ghosh)、阮培元(Tuan-Phong Nguyen)、斯内哈·辛哈尼亚(Sneha Singhania)(教程)
地铁列车时刻表每周讲座+实验室
考试入学要求通过6/8项作业
分级口试(涵盖67%的讲座,33%的作业)
前提条件数据管理和算法基础(例如,通过数据库I和算法以及数据结构讲座),基本编程经验(作业需要中间Python编码)
定位讲座E1 5 002(MPI-SWS底层)中,11.5.、1.6除外。E1 5 029中的
定位实验室E1 5 029(MPI-SWS底层)
注册/沟通公告和问题应张贴在此邮件列表上,如果您(计划)参加本课程,请注册。要求在4.7之前在LSF进行考试注册。

地铁列车时刻表

日期讲座教程(导师)
27.4.1.简介(pdf格式|幻灯片演示文件)数据熟悉(Sneha)[pdf格式,数据,解决方案]
4.5.2.爬行和刮擦(pdf格式|幻灯片演示文件)刮擦(Phong)[pdf格式,实验室02.py,测试_标签02_公共.py,实验室02_解决方案.py]
11.5条。3.实体类型(pdf格式|幻灯片演示文件)从第一个WP句子输入(Hiba)[pdf格式,数据,新数据(_D)]
18.5.4.分类归纳+实体消歧(pdf格式|幻灯片演示文件)分类归纳法(Hiba)[pdf格式,数据,你的阴谋,解决方案]
25.5.5.关系提取(pdf格式|幻灯片演示文件)关系提取(Shrestha)[pdf格式,标签05.zip,解决方案]
1.6.6.关系提取二(续前)开放式信息提取(Shrestha)[pdf格式,标签06.zip]
8.6.7.常识(pdf格式|幻灯片演示文件)常识(Phong)[pdf格式,示例解决方案]
15.6.8.语言模型和知识库(pdf格式|幻灯片演示文件)LMs的KBC(斯涅哈)[pdf格式]
22.6.9.应用(pdf格式|幻灯片演示文件)考试准备(西蒙)
29.6.10.待定/备用插槽待定/备份插槽
11.7.+12.7.口试(注册至4.7。LSF中)-
12.9.重新洗牌(注册至5.9。LSF中)-

    作业

    • 每周有8项作业(第1-8周)
    • 每次提交作业都会收到一个二进制及格/不及格分数
    • 要被录取参加期末考试,至少必须通过6项作业。
    • 每周时间表:
      • 作业于周三上午公布
      • 当天的教程旨在开始作业
      • 作业将于下一周的周一23:59到期
      • 周三上午可以进行评估
    • 分配结果(链接)
    • 注意:本课程不允许剽窃。每种情况都会导致取消课程注册,并向研究系主任报告。

    合作政策

    • 您提交的所有内容,包括代码和文本,都需要独立生成。你的工作必须用你自己的话,并基于你对解决方案的理解。
    • 不要共享代码或书面材料。不要看别人的代码。您可以与他人讨论问题和项目,我们鼓励您这样做,以帮助理解材料,但不要分享书面解决方案。
    • 如果你发现、合并或建立现有材料,例如在网络上或从教科书中,你必须引用来源。

    文学类

    本讲座基于调查“机器知识:综合知识库的创建和管理”,2021财年(pdf格式). 更多参考资料将在相应的讲座中给出。