"Primärdaten als Grundlagen für Veröffentlichungen sollen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden sind, für zehn Jahre aufbewahrt werden."
Empfehlungen zur gesicherten Aufbewahrung und Bereitstellung digitaler Forschungsprimärdaten, DFG: Ausschuss für Wissenschaftliche Bibliotheken und Informationssysteme, Unterausschuss für Informationsmanagement, S. 2, Januar 2009.

Namenskonventionen für Datenkategorien in ISOcat

Die vorgeschlagenen Namensgebungen für die verfügbaren Datenkategorien in ISOcat werden bisher inkonsistent verwendet. Im Allgemeinen sind die Schreibweisen der Kategorien in Kleinbuchstaben angegeben, sofern sie aus nur einem Wort bestehen (z.B. <description></description>). Wenn die Elementnamen aus mehreren Wörtern bestehen, wird das erste Wort in der Regel in Kleinbuchstaben geschrieben und die darauffolgenden Wörter beginnen je ohne Leerzeichen mit einem Großbuchstaben (z.B. <lexicalUnit></lexialUnit>).

Jedoch wird dieses Verfahren nicht konsistent angewendet, wie z.B. bei der Angabe einer ID. Bei alleinigem Auftreten wird der Identifier "id" in Kleinbuchstaben geschrieben (<id></id>), aber der Persistent Identifier "PID" in Großbuchstaben (<PID></PID>). Da für beide Namensgebungen der Datenkategorien jedoch das gleiche Prinzip unterliegt (d.h. der Elementname besteht aus nur einem Wort), sollten auch die Schreibweisen übereinstimmen (d.h. es sollte Kleinschreibung angewendet werden).

Daher werden in Hinblick auf die Namensgebungen für Datenkategorien in ISOcat folgende Konventionen vorgeschlagen, die eine gewisse Ähnlichkeit mit den in Java üblichen Konventionen für Variablen und Klassenbezeichnungen haben:

  • Jeder Elementname für eine Datenkategorie beginnt mit einem Kleinbuchstaben, wenn der Inhalt dieses Elements eine Zeichenkette irgendeiner Art ist.
  • Eine Beschränkung auf Buchstaben erscheint sinnvoll, auch wenn Ziffern außer an erster Stelle auch möglich wären.
  • Wenn Identifier aus mehreren Wörtern bestehen, werden die Wörter ohne Leerzeichen hintereinander geschrieben, wobei jedes neue Wort mit einem Großbuchstaben beginnt. Leerzeichen wären illegal, die Segmentierung in Wörter durch die Großschreibung ausreichend.
  • Namen von Komponenten, also Gruppierungen von Datenkategorien, beginnen analog zu Klassen in Java mit einem Großbuchstaben, ansonsten werden sie klein geschrieben. Bestehen sie aus mehreren Wörtern, erfolgt an der Konkatenationsstelle die Großschreibung, das neue Wort beginnt also mit einem Großbuchstaben.

Zugriff auf ISOcat hat man unter http://www.isocat.org.