The logo is a pig framed between two angle brackets.

Wie man Text und Data Mining für KIs in E‑Books verbietet

In der Verlagsbranche ist das Thema Künstliche Intelligenz genauso beliebt wie gefürchtet. Es geht nicht um das inzwischen etwas abgegriffene Untergangsszenario, dass generative KIs die Bestseller von morgen schreiben. Die aktuellen Risiken sind für Verlage jedoch nicht weniger beunruhigend, wie die Klage der New York Times gegen das Unternehmen OpenAI zeigte: Die New York Times warf OpenAI vor, ihre generative KI ChatGPT mit Millionen Artikeln der Zeitung trainiert zu haben.

(mehr …)

E-Book-Barrierefreiheit: Screenreader und ihre Lesegewohnheiten

Nach der Veröffentlichung der BFSGV blieben viele Fragen unbeantwortet, nicht zuletzt die, wie eigentlich ein barrierefreies E-Book aussehen muss? Wie üblich wenn eine schwergewichtige Frage die Branche umtreibt, werden Experten, Consultants, Working Groups und Task Forces ins Werk gesetzt, mithin ein nicht unwesentlicher Joint Effort, der Recommendations, Guidelines, Best Practices und andere Formen akkumulierter Knowledge produziert.

Doch nicht alles was geraten wird ist gut, sondern manchmal nur gut gemeint. Manche Empfehlungen erzeugen nur hohe Aufwände, obwohl sie nachweislich keine Auswirkungen auf die Barrierefreiheit haben. Daher soll es an dieser Stelle darum gehen, welche Maßnahmen die E-Book-Barrierefreiheit verbessern und welche nur für die Galerie sind.

(mehr …)

Was bringt InDesigns neue UXP Scripting API?

InDesign 2023 bringt vor allem neue Features, nach denen niemand gefragt hat und die keiner braucht: Eine mehr schlecht als recht funktionierende Beta-Version („Technologievorschau“) eines KI-gestützten Autoformatierers. Ein paar neue Bilddateiformate, die selten für Print verwendet werden. Eine Vorschau-Funktion, die Thumbnails der ersten Seite in MacOSX und Windows anzeigt. Immerhin stellt man fest, wie täuschend ähnlich sich Schmutztitel sehen, wenn man sie einmal auf 512 Pixel Breite eindampft. Angesichts dieser Magerkost fragt man sich, warum immer wieder wichtige Features wie Formel- und MathML-Support nachgefragt, aber von Adobe am Ende des Tages doch ignoriert werden. Dennoch könnte sich für das neue UXP Scripting die Installation von InDesign 2023 lohnen.

(mehr …)

Zehn gesetzliche Barriere­­­freiheits­­anforderungen für E‑Books

Eigentlich hatte ich gar nicht vor, gleich wieder einen Artikel zu schreiben. Aber nachdem ich mir heute mal die Verordnung über die Barrierefreiheitsanforderungen für Produkte und Dienstleistungen nach dem Barrierefreiheitsgesetz (BFSGV) durchgelesen hatte, glaube ich, dass das Thema einer Diskussion bedarf. Sicher stellt sich die Frage, was mich eigentlich zur Beschäftigung mit einem juristischen Thema qualifiziert? Ein Semester Urheber- und Medienrecht und eine Vorliebe für kryptische Abkürzungen sind sicher nicht ausreichend. Daher möchte ich auch keinen Gesetzeskommentar schreiben, sondern versuche mich allein mit den technischen Anforderungen in Bezug auf E-Books zu beschäftigen. Wer in Eile ist, kann auch gleich den folgenden Abschnitt überspringen.

(mehr …)

Mind your language, mind your business

Ein selten diskutiertes Thema bei Markup-Sprachen ist das Markup von Sprachen. Dabei geht es nicht nur darum wie man Sprachen auszeichnet, sondern wie man überhaupt an die Sprachinformation gelangt? Fehlendes oder falsches Language Tagging kann viele Probleme für Barrierefreiheit und Typografie bereiten. Aber kann man nicht einfach die richtige Sprache einstellen und die Sache ist erledigt? Ganz so einfach verhält es sich leider nicht.

(mehr …)

Autor:innen nach ihrer Nummer fragen. ISNI, ORCID und Co.

Daten von Autor:innen können manchmal Kopfzerbrechen bereiten, allerdings soll es hier ausnahmsweise nicht um deren Manuskripte, sondern um Autor:innen als Metadatum gehen. Für diesen Artikel habe ich mir ein paar Datensätze von Verlagen angeschaut. Dabei ergab sich, dass in den meisten Fällen die ONIX-Meldung eines bekannten Autors ungefähr so aussehen würden.

(mehr …)

Alternativtexte für Bilder in Word, InDesign und Bildmetadaten kodieren

Seit in vielen Verlagen neben jedem Kopierer ein XML-Konverter steht, lassen sich barrierefreie E-Books leicht und schnell erstellen – solange man Bilder ausklammert. Denn damit ein Bildmotiv für einen Menschen mit Sehbehinderung zugänglich wird, braucht es Alternativtexte und gerade die fehlen leider in vielen E-Books. Doch wie gelangt man zu vernünftigen Alternativtexten und wie lassen sich diese durch den Prozess schleusen?

(mehr …)

Come in, we’re open – Ein paar Worte zu Openwashing

Liebe Verlagsbranche, wir müssen über Openwashing reden. Manchmal beschleicht mich das Gefühl, dass dich bestimmte Trends zehn Jahre später erreichen. Das ist nicht gut, schlimm wird es aber, wenn du Versprechungen Glauben schenkst, die schon vor zehn Jahren durchschaut wurden, etwa dass man beim Jamba-Sparabo was sparen würde.

(mehr …)

Amazons »Enhanced« Typesetting

Amazon überraschte viele Verlage und Self-Publisher:innen vergangene Woche mit der nur wenige Tage vorher angekündigten Umstellung, dass alle gelieferten E‑Books ab 27. Oktober 2020 »Enhanced Typesetting« unterstützen müssen. Schon kurz nach der Ankündigung erreichten mich Anrufe, Tickets und E‑Mails mit den beiden Fragen: unterstützen unsere E‑Books Enhanced Typesetting und was ist das überhaupt?

(mehr …)

Mathematischer Formelsatz in Drucksachen

Auch wenn das Vertrauen in die Erkenntnisse der Naturwissenschaft in diesen Zeiten so unaufhörlich wie die arktischen Polkappen schmilzt, bleibt ihre Publikation eine der wichtigsten und zugleich anspruchvollsten Aufgaben von Verlagen. Neben großformatigen Tabellen und epischen Literaturapparaten sind es vor allem mathematische Formeln, die typografisch und technisch hohe Anforderungen an ihren Satz stellen.

(mehr …)

CSS mit scharfem S

Mit einer Änderung des amtlichen Regelwerks für die deutsche Rechtschreibung darf man nun auch das Eszett, das „scharfe S“ als Großbuchstabe offiziell verwenden. Auch in Windows, Mac OS X Co. kann man das Versal-Eszett schon eingeben, sofern man sich die verschiedenen Tastaturkombinationen merken kann. Doch inwiefern lässt sich das Versal-Eszett auch auf Webseiten oder in E-Books richtig darstellen?

(mehr …)

License to Bill – Schriftlizenzen für E‑Books

Wenn in meinem beruflichen Umfeld über die Qualität einer Schrift gesprochen wird, dann fühlt man sich mitunter an eine Weinprobe erinnert. Es geht wie beim Wein um die Herkunft, welche sich etwa anhand einer barocken Tropfenform erschließt. Die Schrift sollte vor allem im Korpus, also bei etwa 10 Didot-Punkt für das Auge gut genießbar sein und der Charakter kann sich jung, grob oder elegant ausnehmen. Während man zweifelsohne viel über die beste Schrift für das Buch nachdenkt, hält sich das Engagement bei E‑Books hingegen in Grenzen.

(mehr …)

Ein E-Book für alle: Wie wird EPUB barrierefrei?

EPUB sei als Format besonders gut für die Produktion barrierefreier E-Books geeignet. Dabei bieten viele EPUBs auf dem Markt nicht nur keine besondere Unterstützung für Blinde und Sehbehinderte, sondern legen ihnen noch zusätzliche Steine in den Weg.

(mehr …)

XProc 2.0 – Go with the Flow

The new draft of XProc 2.0 won’t have much in common with version 1.0. What a look over Norman Walsh’s shoulder between the sessions of the past XML Amsterdam already foreshadowed: At this year’s XML Prague, the W3C Working Group revealed a slimmed down version of XProc as Alex Milowski announced in a tweet.

(mehr …)

Nachtrag zu Ligaturen in E‑Books

Dieser Beitrag geht auf einen kurzen Austausch auf Twitter über Ligaturen in E‑Books zurück. Der Auslöser waren Probleme bei der Darstellung von Ligaturen in vielen E‑Book-Readern. Doch ist es fraglich, ob allein eine bessere technische Unterstützung für Ligaturen auch zu einer besseren Typografie in E‑Books führen würde?

(mehr …)

Mehr Openness für Verlage – Open Source, offene Standards und offene APIs

Ohne Software entsteht im Verlag kein Buch mehr. Von der Produktplanung über Manuskriptbearbeitung, Satz, Datenkonvertierung bis hin zur Auslieferung – viele lebenswichtige Prozesse sind heute ohne die Unterstützung von Software nicht mehr denkbar. Dabei machen sich Verlage nicht selten von einzelnen Software-Anbietern abhängig. Open-Source-Software, offene Standards und offene Schnittstellen bieten einen Ausweg.

(mehr …)

XML und InDesign III – Das seltsame Doppelleben von XML und Satz

Die XML-Features von InDesign haben bei der Entwicklung offenbar wenig Aufmerksamkeit von Adobes Ingenieuren erfahren. Anders sind die zahlreichen Beschränkungen bei der XML-Verarbeitung mit InDesign kaum zu erklären. InDesign- und XSLT-Skripte vermögen zwar viele Lücken zu schließen, ziehen aber aufwändige Vor- und Rückkonvertierungen des mitgeführten XML nach sich. Doch welcher Eindruck ergibt sich, wenn man die Perspektive des Entwicklers verlässt und die des Setzers einnimmt?

(mehr …)

E-Buchgestaltung

Man kann nicht viel gewinnen, wenn man einen Vortrag über E‑Books vor StudentInnen des Gestaltungsfachs halten muss. Die typografischen Beschränkungen von E‑Books* sind zu eklatant, als dass Menschen mit buchgestalterischen Ambitionen nicht wenigstens abgeschreckt sind, dieses Feld zu ihrer Spielwiese zu erklären. Würde man E‑Books aber nur auf die Leitdifferenz typografischer Ästhetik eng führen, käme man wohl wie Friedrich Forssmann schnell auf die Rede von „den albernen Dateien, die gern Bücher wären“**.

(mehr …)

Mit XProcs p:http-request auf APIs zugreifen

Dem Anlass eines grippalen Infektes angemessen, habe ich mich mit der API des Online-Virenscanners VirusTotal auseinander gesetzt. Resultat ist ein XProc-Step*, welcher mittels der VirusTotal-API Dateien zum VirusTotal-Web-Service schiebt und die Prüfergebnisse abholt.

(mehr …)

XML und InDesign II – Ein Skript hilft da, wo’s schmerzt?

Wie im vorangegangen Teil deutlich wurde, bleibt beim XML-Import in InDesign einiges auf der Strecke. Fußnoten, Querverweise, Indexeinträge und Hyperlinks werden nicht importiert. Auch verankerte Rahmen für Marginalien, Bilder und Boxen lassen sich nicht automatisch erstellen. Wer mit importiertem XML mehr als ein Plakat setzen möchte, ist also auf Alternativen angewiesen.

Dafür bietet sich InDesigns Skripting-Schnittstelle an. Mit ihr lassen sich eigene Skripte ausführen, die z. B. automatisch XML-Elemente in entsprechende Layoutobjekte umwandeln. InDesign unterstützt dafür JavaScript und je nach Plattform VBScript (Windows) oder AppleScript (Mac OSX). InDesign-Skripte gehören auch in professionellen Satzbetrieben zum festen Inventar, lassen sich damit doch viele Aufgaben automatisieren bzw. schmerzlich vermisste InDesign-Funktionen nachrüsten.

(mehr …)

XML und InDesign I – Tücken des XML-Imports

InDesign war ursprünglich nur als reines DTP-Programm konzipiert. Unter dem Eindruck des XML-Hypes Anfang der 2000er versah Adobe seine Software mit Funktionen zur Verarbeitung von XML-Daten. Für Verlage und Satzdienstleister klang die Lösung zunächst vielversprechend: Ohne XML-Editor und Programmieren lässt sich das XML in InDesign importieren, im Hintergrund mitführen und nach dem Satz inklusive Korrekturen einfach wieder herausspielen.

InDesign schien nun auch für „XML-First“-Workflows geeignet und versprach gleichzeitig die Produktion von anspruchsvollen Layouts und sauberen XML-Daten. In der Praxis weist InDesigns XML-Import allerdings zahlreiche Löcher auf, die mit Skripten gestopft werden müssen. Der Satz mit XML ist umständlich, erfordert viele händische Eingriffe und ist dadurch fehleranfällig. Dennoch möchte man in Verlagen weder auf InDesign noch auf XML verzichten. Der folgende Artikel ist Teil einer kleinen Serie über InDesign und XML und rückt zum Anfang die XML-Import-Funktion in den Fokus.

(mehr …)

Das E-Book der Zukunft ist anders. Sie kennen es bereits.

Produktion, Vertrieb und Konsum von elektronischen Büchern folgen heute immer noch dem Vorbild der gedruckten Bücher: Der Verlag liefert das Manuskript an einen Dienstleister, der das E-Book erstellt. Das E-Book wird durch eine digitale Auslieferung in den Online-Buchhandel gebracht. Dort wird das E-Book als einzelnes Produkt zu einem festen Preis verkauft. Der Kunde verfügt nach dem Kauf über das E-Book als Datei und liest es wo und wann er mag.

Dieses Modell hat sich etabliert, nicht zuletzt weil es Verlagen erlaubt, ihre gewohnten ISBN-fähigen Produkte beizubehalten. Allerdings mehren sich die Anzeichen, dass dieses Modell bei elektronischen Büchern in Zukunft abgelöst wird.
(mehr …)

Web Components: Die Zukunft oder das Ende des Webs wie wir es kennen

Wenn über die Zukunft des Webs gesprochen wird, kommt man an „Web Components“ nicht vorbei. Dabei handelt es sich um eine Reihe von Entwürfen für kommende Standards des W3C, die es erlauben sollen, mit selbst definierten HTML-Tags wiederverwendbare Komponenten für das Web zu schaffen. Robin Berjon, Mitautor des HTML-Standards hat auf der XML Prague 2014 in einem Vortrag das Konzept vorgestellt. Von den Browser-Herstellern haben Google mit „Polymer Project“ und Mozilla mit „X-Tags“ eigene experimentelle Ansätze in diesem Jahr präsentiert.

(mehr …)

Mit URIs weg von ausgetretenen Pfaden

Ein wesentlicher Baustein für die modulare Architektur unseres XProc-Frameworks transpect ist die Verwendung von URIs für die Repräsentation von Pipelines, Stylesheets und Datensätzen. Auch andere Frameworks wie das von Romain Deltour auf der XML Prague 2013 vorgestellte DAISY Pipeline Framework und Florent Georges EXPath-Packaging System machen sich dieses Konzept zu eigen. URIs können die Wiederverwendbarkeit von Bibliotheken vereinfachen und das Handling von XML-Dokumenten und externen Ressourcen erleichtern.

(mehr …)

It is a dynamic error…

XProc 1.0 wurde vor vier Jahren am 11. Mai als W3C Recommendation verabschiedet. Vor knapp drei Jahren begann ich selbst mit XProc zu entwickeln. Seitdem verwende ich die Programmiersprache bei nahezu jedem neuen XML-Projekt und nicht zuletzt bildet sie auch die Grundlage für unser Open Source Framework transpect. Das Lernen von XProc ist jedoch keine Selbstverständlichkeit. Die Syntax ist umständlich, das Debuggen ist kompliziert und es funktioniert vieles nicht, wie man es vielleicht von XSLT gewohnt sein mag. Dieser Beitrag versteht sich daher als Anfang einer kleinen Serie, die beschreibt wie man sich mit XProc das Leben mit XProc leichter machen kann.

(mehr …)

EPUB ist das neue PDF – und das ist nicht gut so

Für die elektronischen Derivate von Roman, Sachbuch oder Comic hat sich EPUB als Standard etabliert. Bei wissenschaftlichen Publikationen führte bisher kein Weg am PDF vorbei. Ist die Zeit nun reif für die Umstellung auf EPUB?

(mehr …)