There are established software solutions to convert from XML to TeX. Nevertheless, these approaches either limit the configurability of the TeX output or introduce a lot of programming effort. In this paper, we will discuss these methods and present an alternative approach that hopes to offer the greatest possible flexibility based on fixed conversions, an extensible configuration and the injection of XSLT, and that forms the basis for our Open Source typesetting system xerif. This talk was held at the Queen Mary University of London for the Markup UK on June 2, 2023. The full paper has been published in the MarkupUK proceedings.
Mind your language, mind your business
Ein selten diskutiertes Thema bei Markup-Sprachen ist das Markup von Sprachen. Dabei geht es nicht nur darum wie man Sprachen auszeichnet, sondern wie man überhaupt an die Sprachinformation gelangt? Fehlendes oder falsches Language Tagging kann viele Probleme für Barrierefreiheit und Typografie bereiten. Aber kann man nicht einfach die richtige Sprache einstellen und die Sache ist erledigt? Ganz so einfach verhält es sich leider nicht.
From GitHub to GitHub with XProc. An approach to automate documentation for an Open Source project with XProc and the GitHub Web API.
This talk was held at the Balisage Markup Conference 2016 in Bethesda (Maryland, USA) on August 8, 2016. The paper to this talk was published in the Balisage proceedings.
XProc 2.0 – Go with the Flow
The new draft of XProc 2.0 won’t have much in common with version 1.0. What a look over Norman Walsh’s shoulder between the sessions of the past XML Amsterdam already foreshadowed: At this year’s XML Prague, the W3C Working Group revealed a slimmed down version of XProc as Alex Milowski announced in a tweet.
Mit XProcs p:http-request auf APIs zugreifen
Dem Anlass eines grippalen Infektes angemessen, habe ich mich mit der API des Online-Virenscanners VirusTotal auseinander gesetzt. Resultat ist ein XProc-Step*, welcher mittels der VirusTotal-API Dateien zum VirusTotal-Web-Service schiebt und die Prüfergebnisse abholt.
docx2tex – Ein Werkzeug für die Konvertierung von DOCX nach LaTeX
Im schönen Stralsund durfte ich auf der DANTE-Frühjahrstagung das Tool docx2tex und die dazugehörige Bibliothek xml2tex vorstellen. Davor habe ich docx2tex als erstes transpect-Projekt nebst Bibliotheken von unserem öffentlichen SVN auf GitHub migriert. Wie üblich ist man damit auch erst so richtig fertig, wenn der Zug in den Zielbahnhof einfährt. Daher hatte ich nicht ernstlich damit gerechnet, dass Herbert Voß das Tool in der Zwischenzeit schon erfolgreich ausprobiert hatte, wie er in der freundlichen Ankündigung meines Vortrags anmerkte. Seit der ersten Vorstellung des Prototyps auf dem Demojam der XML Prague 2014 hatte sich unterdessen auch viel getan.
Mit URIs weg von ausgetretenen Pfaden
Ein wesentlicher Baustein für die modulare Architektur unseres XProc-Frameworks transpect ist die Verwendung von URIs für die Repräsentation von Pipelines, Stylesheets und Datensätzen. Auch andere Frameworks wie das von Romain Deltour auf der XML Prague 2013 vorgestellte DAISY Pipeline Framework und Florent Georges EXPath-Packaging System machen sich dieses Konzept zu eigen. URIs können die Wiederverwendbarkeit von Bibliotheken vereinfachen und das Handling von XML-Dokumenten und externen Ressourcen erleichtern.
It is a dynamic error…
XProc 1.0 wurde vor vier Jahren am 11. Mai als W3C Recommendation verabschiedet. Vor knapp drei Jahren begann ich selbst mit XProc zu entwickeln. Seitdem verwende ich die Programmiersprache bei nahezu jedem neuen XML-Projekt und nicht zuletzt bildet sie auch die Grundlage für unser Open Source Framework transpect. Das Lernen von XProc ist jedoch keine Selbstverständlichkeit. Die Syntax ist umständlich, das Debuggen ist kompliziert und es funktioniert vieles nicht, wie man es vielleicht von XSLT gewohnt sein mag. Dieser Beitrag versteht sich daher als Anfang einer kleinen Serie, die beschreibt wie man sich mit XProc das Leben mit XProc leichter machen kann.
transpect demo at Hybrid Publishing Lab
From 2nd to 3rd July, Gerrit Imsieke and me participated in a workshop on standards in multi-format publishing workflows of Hybrid Publishing Lab at Leuphana University, Lüneburg. The workshop was the first part of a series of events for discussion between stakeholders in the open source digital publishing community. During the workshop, we presented our open source framework transpect.