©DFKI，柏林

语音和语言技术

主题领域：文本分析

在德国，Welt wächst die Menge an Informationonen，die auf Webseiten，sozialen Medien und In digitalen Dokumenten digital verfügbar sind，jeden Tag erheblich。vielen Anwendungsbereichen的Die Analyse und Nutzung dieser Informationonen is ein kritischer Prozess–商业智能、医学Entscheidungsfindung、Kundenbetreung、Wissensmanagement und Prävention von Cyberkriminalität。Dieüberwiegende Mehrheit dieser Informationonen liegt jedoch in Form von unstrukturiertem，geschriebenem Text vor，der nicht ohne weiteres automatisch von einem计算机程序分析员werden kann

Das Gebiet der Textanalysik、einem Teilgebiet der Verarbeitung natürlicher Sprache、zielt darauf ab、zu verstehen、wie Menschen natü）、um Informationonen und Wissen zu virmatteln。Es entwicket Techniken und Modelle zu entwicken，die Es Computer programmen ermöglichen，Informationen und Wissen aus unstrukturierten Textdokumenten zu extrahieren und in struktulierter Form zur Weiterverarbeitung durch computer gestützte Anwendungen verfügbar zu machen。Beispielsweise kann die Entdecung unerünschter Arzneimittelwirkungen ausöffentlichen Patientenforen dieöffent liche Gesundheit und die Patientensicherheit bei der Medikamenteninnahme verbessern，我们的自动化系统是由Zusammenhang的Nachrichten和Zusammenhang的Lieferantennetzwerk组成的Unternehmens kann das Lieferkettenrisikanagement verbessern和und eine schnelle Entscheidungsfindung ermöglichen。

Eine große Herausforderung bei der Textanalysik besteht darin，dass menschliche Sprachverwendung implizit ist–sie lässt Informationonen aus。Das Füllen dieser Informationsslücke erfordert kontextuelles Schlussfolgern，Hintergrund und Allgemeinwissen sowee Schlusspolgernüber den situateven Kontext。Sprache entwicket sich zudem ständig weiter，d.h.sie spezialisiert und verändert sich im Laufe der Zeit公司。Daher fordert Sprachverständnis auch eine kontinuierliche und effiziente Anpassung an neue Sprachen und Domänen–und den Transfer zu und zwischen beiden。Gegenwärtige Textanalysikmethoden konzentrieren sich jedoch auf Sprachen und Domänen mit vielen Ressourcen，verwenden wenig bis gar keinen Kontext und gehen von statischen Daten-，Aufgaben-und Labelvertilungen aus。

Die Forschung des DFKI语音与语言技术实验室zielt darauf ab，diese Herausforderungen anzughen。Unsere Arbeit in der Textanalysik konzentriert sich auf Kernforschung zur Domänenanpassung，Lernen in Umgebungen mit geringen Ressourcen，Schlußfolgernüber gröÞere Kontexte，kontinuierliches Lernen，sowie multimulagen Modellen；在Domänen wie Gesundheit/Medizin，Industrie und Mobilität。在Sprache zu entwickeln的menschlichen Sprache和Denkens的Verständnis研究中，我们发现了Ziel、Verarbeitung和Generierung的新方法、Sprache和Wissen。

Zu diesem Zweck kombinieren wir tiefgreiende languageische Analysen mit modernstem maschinellem Lernen und neuronalen Ansätzen für NLP的语言分析。

Weitere wichtige Aspekte unserve Arbeit sind die Erstellung annotierter Korpora zum Training und zur Evaluation von NLP-Modellen，die（语言学家）Bewertung von NLP Datensätzen und-Aufgaben sowie die Erklärbarkeit von（neuronalen）Modellen。在信息传播和Wissensbasispopopulation、Stimmungsanalyse、Textklassifizierung和Zusammenfassung中，我们看到了Grundlagen和Angewander Forschung。Viele unser State-of-the-Art-Forschungsergebinsse werden der Community aufgithub.com/DFKI-NLP/Verfügung gestellt餐厅。Weitere Informationonen zu unsern Projekten，Coderepositorien，und Datensätzen finden Sie unter公司dfki-nlp.github.io.

澳大利亚项目：

Cora4NLP-Kontextuales Denken und Adaptieren für die Verarbeitung natürlicher Sprache公司
PLASS-Plattform für分析供应链管理服务
BiFOLD-柏林学习与数据基础研究所
XAINES公司

代码和模型

链接

DFKI的Sprachtechnologie