The logo is a pig framed between two angle brackets.

Autor:innen nach ihrer Nummer fragen. ISNI, ORCID und Co.

Daten von Autor:innen können manchmal Kopfzerbrechen bereiten, allerdings soll es hier ausnahmsweise nicht um deren Manuskripte, sondern um Autor:innen als Metadatum gehen. Für diesen Artikel habe ich mir ein paar Datensätze von Verlagen angeschaut. Dabei ergab sich, dass in den meisten Fällen die ONIX-Meldung eines bekannten Autors ungefähr so aussehen würden.

<Contributor>
  <SequenceNumber>1</SequenceNumber>
  <ContributorRole>A01</ContributorRole>
  <PersonName>Ian Fleming</PersonName>
  <PersonNameInverted>Fleming, Ian</PersonNameInverted>
  <ProductNamesBeforeKey>Ian</ProductNamesBeforeKey>
  <ProductKeyNames>Fleming</ProductKeyNames>
</Contributor>

Autor:innen werden durch ihren Vor- und Nachnamen identifiziert. Das macht Sinn, denn Ian Fleming ist bekannt für große Werke wie „Spectroscopic Problems in Organic Chemistry“, „Frontier Orbitals and Organic Chemical Reactions“ und „Selected Organic Syntheses: A Guidebook for Organic Chemists“.

Aber hat Ian Fleming nicht eigentlich Romane über einen britischen Geheimagenten geschrieben, dessen Missionen ihn verdächtig oft zu exklusiven Urlaubsorten führen, wo er alkoholisiert Frauen belästigt und seine Tarnung bereits bei der Vorstellung mit Vor- und Nachnamen preisgibt? Offenbar liegt hier eine Verwechslung vor.

Dabei gibt es bessere Möglichkeiten, als sich einfach mit „Bond, James Bond“ auszuweisen. Um Autor:innen und ihre Werke eindeutig zu identifizieren, könnte man auch auf sogenannte „Identifier“ setzen. Für eine Reihe von Identifiern bietet z.B. ONIX das Element <NameIdentifier>. Mit <NameIDType> kann die Art des Identifiers als zweistellliger Code angegeben werden. <IDValue> enthält dann den Identifier selbst.

<NameIdentifier>
  <NameIDType>16</NameIDType>
  <IDValue>0000000453026837</IDValue>
</NameIdentifier>

In dem Beispiel oben wird der Bond-Autor Ian Fleming mit einem International Standard Name Identifier (ISNI) repräsentiert. ISNI ist ein internationaler Standard zur Identifizierung von Personen, die schöpferisch tätig sind (ISO 27729). Autor:innen können über einen 16-stelligen numerischen Code, in diesem Fall 0000-0004-5302-6837 identifiziert werden.

Die meisten Autor:innen erhalten ihren Identifier übrigens automatisch. Wenn Nationalbibliotheken wie die British Library oder die Bibliothèque nationale de France Bücher von neuen Autor:innen katalogisieren, registrieren sie gleichzeitig einen neuen ISNI für sie.

In Deutschland, Österreich und der Schweiz wird allerdings nicht der ISNI, sondern die klangvolle „Gemeinsame Normdatei“ (GND) verwendet. Die GND-Nummer ist ein neun-stelliger Code. Für Ian Fleming, den Bond-Autor, lautet die Nummer: 118691724.

Neben ONIX bieten auch offene XML-Standard-Schemas wie DocBook, JATS und TEI passende Elemente für die Auszeichnung von Autor:innen-IDs. Dabei können auch verschiedene Identifier gleichzeitig verwendet werden:

DocBook

<uri role="isni">https://isni.org/isni/0000000453026837</uri>

JATS

<contrib-id contrib-id-type="isni">0000000453026837</contrib-id>

TEI

<ident type="isni">0000000453026837</ident>

Für die globale Forschungswelt ist die eindeutige Identifizierung von Autor:innen eines Werks von besonderer Bedeutung. Denn die Relevanz von Wissenschaftler:innen bemisst sich nicht zuletzt daran, wie oft ihre Publikationen in anderen wissenschaftlichen Veröffentlichungen zitiert werden. Dafür gibt es sogar eine bibliometrische Kennzahl, den sogenannten Hirsch‑index, kurz h-index. Wissenschaftliche Datenbanken wie Scopus oder Web of Science geben den h-index für Wissenschaftler:innen an. So hat z.B. Christian Drosten (54.572 Zitationen bei Scopus) einen h‑Index von 94, Sandra Ciesek (4.041) hat 32 während für Alexander Kekulé (1.271) nur ein h‑Index von 14 ausgewiesen wird. Der h‑index ist wie die Anzahl von Talkshow-Teilnahmen allerdings eine rein quantitative Messgröße und keine Messlatte für die Qualität einer wissenschaftlichen Arbeit.

Für Wissenschaftler:innen hat sich inzwischen ORCID („Open Researcher Contributor Identification Initiative“) als eigener Standard etabliert. Wissenschaftler:innen können für sich auf https://orcid.org eine ORCID ID registrieren und ihre Publikationen dort verknüpfen. ORCID IDs basieren auch auf der ISO 27729, also dem ISNI-Standard. Auch wenn ISNI und ORCID unterschiedliche Ziele verfolgen und keine gemeinsamen Strukturen teilen, haben die Organisationen gemeinsam festgelegt, dass ORCID IDs nur in dem festgelegten Bereich von 0000-0001-5000-0007 bis 0000-0003-5000-0001 registriert werden. Auf diese Weise sollen ISNI und ORCID nicht kollidieren und Überschneidungen verhindert werden.

Nichtsdestotrotz kann die falsche Verwendung von ORCID IDs auch Probleme bereiten, wie Baglioni et. al in ihrem Paper „Reflections on the Misuses of ORCID iDs“ erläutern. So können nicht existente oder falsch zugeordnete ORCID IDs Probleme bereiten. Auch wenn Autor:innen mehrere ORCID IDs registriert hat, erschwert das die Zuordnung. Verlage können aber durch geeignete Prüfmechanismen sicherstellen, dass die ORCID-Zuordnung funktioniert, z.B. über einen Abgleich mit der ORCID Web API.

Wenn Autor:innen einfach nur eine Ziffer vergessen haben, ließe sich das mit einem regulären Ausdruck prüfen. Aber auch bei einem Zahlendreher kann man eine ORCID ID noch validieren, denn die letzte Stelle ist ein Prüfzeichen. Nach dem Standard ISO/IEC 7064, MOD 11-2 kann man ein Prüfzeichen aus den vorherigen Ziffern berechnen. Das berechnete Prüfzeichen ist eine Zahl zwischen 0 und 9 oder „X“ (steht für 10) und kann mit dem angegebenen Prüfzeichen verglichen werden. Eine Implementierung der ORCID-Validierung als XSLT-Funktion hab ich vor kurzem auf GitHub gestellt. Beispiele für andere Programmiersprachen finden sich direkt bei ORCID.

Ein anderes Beispiel, wie ORCID und ISNI verwendet werden können, ist in Verbindung mit ISCCs (International Standard Content Codes). ISCC Codes sind dezentrale Identifier, die aus Medien-Dateien, wie z.B. PDFs, EPUBs oder Bildern generiert werden und z.B. in dezentralen Registries oder Blockchains registriert werden können. Die „Attribution“, der Anspruch des Urhebers auf sein Werk, kann z.B. mit einer ORCID-ID oder einem ISNI-Code zertifiziert werden.

Statt darauf zu vertrauen, dass die Zuordnung von Autor:innen zu ihren Werken nur mit ihrem Namen ausreicht, lohnt es sich diese mit eindeutigen Identifiern auszustatten. Da aber nicht jede/r Autor:in schon über einen ISNI- oder ORCID-Code verfügt, kann man im Verlag auch eigene IDs vergeben. XML-Schemas wie DocBook, JATS und TEI erlauben, dass man mehrere Identifier parallel mitführt. Um sicherzustellen, dass die Identifier valide sind, kann man zudem auf etablierte Methoden wie Prüfsummen zurückgreifen.

To keep the long story short: Identifier ermöglichen, dass Metadaten eindeutig zugeordnet werden können und beim Austausch der Daten keine Fehler entstehen. Auch andere an einem Werk beteiligte Entitäten wie Satzbetriebe, Druckereien oder Stiftungen können z.B. über deren Steuernummer dargestellt werden. Oder angelehnt an Flemings britischen Geheimagenten: Verstehen Sie etwas von Waffen, Mr. Bond?“ – „Nein, aber von Metadaten.“

Dank: Sebastian Posth für das Auseinanderklamüsern des Verhältnisses von ISCC zu ORCID und ISNI.

Archiv

Tags

Alternativtexte Amazon ARIA Barrierefreiheit BFSG BFSGV books in browsers CSS E-Books EAA Enhanced Typesetting EPUB EPUB3 GND HTML InDesign ISCC ISNI JavaScript KF8 Kindle Language Tagging LaTeX Machine Learning MathML MOBI Open Source ORCID PDF Publishing RelaxNG Schematron STM SVG TeX tl;dr transpect Typografie Unicode UXP Web Components Word XML XProc XSLT