"Forschungsprimärdaten bilden einen wertvollen Fundus an Informationen, die mit hohem finanziellem Aufwand erhoben werden. Je nach Fachgebiet und Methode sind sie replizierbar oder basieren auf nicht wiederholbaren Beobachtungen oder Messungen. In jedem Fall sollten die erhobenen Daten nach Abschluss der Forschungen öffentlich zugänglich und frei verfügbar sein."
Aus: Empfehlungen zur gesicherten Aufbewahrung und Bereitstellung digitaler Forschungsprimärdaten, DFG: Ausschuss für Wissenschaftliche Bibliotheken und Informationssysteme, Unterausschuss für Informationsmanagement, S. 2, Januar 2009.

Willkommen beim Zentrum für Nachhaltigkeit Linguistischer Daten (NaLiDa)

Sprachressourcen wie Korpora, Lexika, Grammatiken, Experimentaldaten oder Computerprogramme werden in der linguistischen Forschung immer wichtiger. Jedoch ist ihre Erstellung häufig sehr komplex, Informationen gehen auf lange Sicht verloren oder können nicht mehr verarbeitet werden. Das NaLiDa-Projekt am Seminar für Sprachwissenschaft (SfS) der Eberhard Karls Universität Tübingen beschäftigt sich damit, wie derartige Daten langfristig für Forschungsfragestellungen bereit gehalten werden können.

Im Fokus stehen dabei folgende Aspekte:

  • Sammeln von Ressourcen
  • Erfassen von Daten
  • Zugang zu den Daten
  • Rechtliche und ethische Aspekte der Langzeitarchivierung
  • Standards für Sprachressourcen
  • Beratung zu allen Aspekten der Datenhaltung digitaler Texte
  • Erstellung eines Migrationskonzepts zur Übergabe der Forschungsdaten aus dem fach-spezischen Repositorium in ein fach-übergreifendes Repositorium; Verbringen der Daten aus der Linguistik in die Infrastruktureinrichtung der Universität (innerhalb der 2. Förderphase).

Dokumentation

Wissenschaftler können vom NaLiDa-Zentrum Hilfestellung bei der Erstellung von Beschreibungen (Metadaten) für ihre Ressourcen und der Archivierung erhalten. So können sich Forscher ganz auf ihre Daten konzentrieren.

Katalog

Das Archiveren und Publizieren von Forschungsprimärdaten erfordert auch, dass man die Daten finden kann. Dazu dienen Kataloge, die auf Beschreibungen in Form von Metadaten beruhen und die öffentlich zugänglich sind.

Portal

Der Einstieg zu Sprachressourcen, die Beschreibung von gängigen Verfahren und die Sammlung von aktuellen Informationen stellen neben der Vernetzung von Ressourcenerstellern die grundlegenden Funktionen dieses Portals dar.