"Der Wissenschaftsrat fordert insbesondere die Forschungsförderer auf, Anreize zu schaffen, um qualitativ hochwertige Daten zu archivieren und langfristig zu sichern. Zu diesem Zweck sollten Referenz- und entsprechende Zitationsmöglichkeiten für Datensätze aufgebaut werden. Persistent Identifier (PID) bzw. Digital Object Identifier (DOI) erlauben eine eindeutige Identifizierung und Zitierbarkeit digital hinterlegter Daten selbst dann, wenn sie ihre Speicherorte (in der Regel referenziert über den Uniform Resource Locator, URL) wechseln."
Empfehlung zu Forschungsinfrastrukturen in den Geistes und Sozialwissenschaften, Wissenschaftsrat, Berlin, 28.01.2011, S.58

Willkommen beim Zentrum für Nachhaltigkeit Linguistischer Daten (NaLiDa)

Sprachressourcen wie Korpora, Lexika, Grammatiken, Experimentaldaten oder Computerprogramme werden in der linguistischen Forschung immer wichtiger. Jedoch ist ihre Erstellung häufig sehr komplex, Informationen gehen auf lange Sicht verloren oder können nicht mehr verarbeitet werden. Das NaLiDa-Projekt am Seminar für Sprachwissenschaft (SfS) der Eberhard Karls Universität Tübingen beschäftigt sich damit, wie derartige Daten langfristig für Forschungsfragestellungen bereit gehalten werden können.

Im Fokus stehen dabei folgende Aspekte:

  • Sammeln von Ressourcen
  • Erfassen von Daten
  • Zugang zu den Daten
  • Rechtliche und ethische Aspekte der Langzeitarchivierung
  • Standards für Sprachressourcen
  • Beratung zu allen Aspekten der Datenhaltung digitaler Texte
  • Erstellung eines Migrationskonzepts zur Übergabe der Forschungsdaten aus dem fach-spezischen Repositorium in ein fach-übergreifendes Repositorium; Verbringen der Daten aus der Linguistik in die Infrastruktureinrichtung der Universität (innerhalb der 2. Förderphase).

Dokumentation

Wissenschaftler können vom NaLiDa-Zentrum Hilfestellung bei der Erstellung von Beschreibungen (Metadaten) für ihre Ressourcen und der Archivierung erhalten. So können sich Forscher ganz auf ihre Daten konzentrieren.

Katalog

Das Archiveren und Publizieren von Forschungsprimärdaten erfordert auch, dass man die Daten finden kann. Dazu dienen Kataloge, die auf Beschreibungen in Form von Metadaten beruhen und die öffentlich zugänglich sind.

Portal

Der Einstieg zu Sprachressourcen, die Beschreibung von gängigen Verfahren und die Sammlung von aktuellen Informationen stellen neben der Vernetzung von Ressourcenerstellern die grundlegenden Funktionen dieses Portals dar.