Projekt Details

SIR-III

Projektleiter:   Erhard Hinrichs
Projektmitarbeiter:   Reinhild Barkey, Researcher
Homepage:http://www.ukp.tu-darmstadt.de/research/current-projects/sir-3/

Absicht

Das wichtigste wissenschaftliche Ziel des Projekts ist die Schaffung einer großangelegten, bedeutungsdisambiguierten, lexikalisch-semantischen Übersetzungsressource mit Daten aus Wikipedia, Wiktionary und EuroWordNet, sowie die Umsetzung neuer lexikalisch-semantischer Methoden für cross-linguales Information Retrieval. Die Lesartendisambiguierung der Suchterme ist dabei eine besondere Herausforderung, da mehrdeutige Terme zu falschen Übersetzungen und damit zu irrelevanten Dokumenten im Suchergebnis führen können.

Die Erweiterung von GermaNet und die zugehörige Anbindung an EuroWordNet ist ein weiterer zentraler Aspekt für die Schaffung dieser Übersetzungsressource. Mit Hilfe der Ressource werden neue Methoden für cross-linguales Information Retrieval entworfen und analysiert, die

  • auf trainierten statistischen Übersetzungsmodellen basieren und
  • auf eine Verbesserung automatischer Übersetzungssysteme abzielen.