docx2tex

Ein Werkzeug für die Konvertierung
von DOCX nach LaTeX

@mkraetke / martin.kraetke@le-tex.de

Martin Kraetke

Lead Content Engineer bei le-tex in Leipzig

  • le-tex: Verlagsdienstleister aus Leipzig

  • gegründet 1999, inzwischen ca. 150 Mitarbeiter (90 VBE)

  • Satz, Herstellung, Bildbearbeitung, E-Book-Produktion, Softwareentwicklung, Datenkonvertierung

LaTeX bei le-tex

  • Wissenschaftlicher Satz u.a. für De Gruyter,
    Springer, Wiley

  • Entwicklung von Templates und Autorenberatung

  • Automatischer Satz aus XML

  • Konvertierung der Autorenmanuskripte
    nach LaTeX, meistens aus DOCX

Word-Import mit
Chikrii Word2teX

  • VBA-Plugin, hohe Lizenzkosten, nicht Open-Source

  • Verluste von Formelzeichen, Auszeichnungen, Text

  • geringe Stabilität: Qualität schwankt zwischen Versionen

Keine Alternativen auf dem Markt?

wir entwickeln was neues!

Anforderungen

  • Konfigurierbar für verschiedene Manuskripte

  • Formeln (MathML und MathType*), komplexe Tabellen

  • für manuellen und automatischen Satz gleichzeitig anwendbar

* MathType-Support nur für interne Produktion

docx2tex

  • DOCX = XML ⇒ in XSLT und XProc implementiert

  • frei zum Download auf GitHub

  • Open Source, BSD 2-clause “Simplified License”

docx2tex

  • basiert auf konfigurierbarer xml2tex-XProc-Pipeline

  • CALS-Tabellen werden als tabular konvertiert, HTML-Tabellen folgen bald

  • mml2tex-Stylesheet zum Konvertieren
    von MathML nach LaTeX

To-Do

  • Formelkonvertierung ausbauen, z.B. für
    diakritische Zeichen

  • HTML-Tabellenmodell integrieren

  • schlichtere Konfigurationsdatei für
    einfaches Style-Mapping

  • Stabilität, Performance etc.

Vielen Dank für
Ihre Aufmerksamkeit