Extraktion von Prädikat-Argumentstrukturen aus NPs
Student: N/A
Supervisor: Manfred Klenner, Anne Göhring
Einleitung
Prädikat-Argumentstrukturen repräsentieren die hinter einem Satz oder einer NP stehende Ereignisstruktur. In "die Würdung des Ministers durch den Senat" erkennen wir das Prädikat "würdigen" und zwei seiner Mitspieler "Senat" (Akteur) und "Minister" (Patiens). Der Genitiv kann beides bezeichen und ist daher ambig. Im Projekt sollen Daten annotiert und mittels Machine Learning und ggfs. einer regelbasierten Komponente sollen die Strukturen extrahiert.
Ziel
Annotation von Daten: komplexe NPs hinsichtlich der Argumentstruktur.
Trainieren und Evaluieren eines Extraktors (ML- oder regelbasiert)
Voraussetzungen
- solide Pythonkenntnisse
- Machine Learning (inkl. Deeplearning)
Vorgehen
- Extraktion von komplexen NPs aus Korpus
- Analyse der verschiedene Fälle
- Annotation ausgewählter Beispiele
- Aussetzen einer ML-Architektur
- Trainieren und Evaluieren
Ressourcen
Textkorpus für Deutsch (evtl. Tüba)