Publishing mit XML

Workflow und Tools


Table of Contents
1. Warum Publishing mit XML?
2. XML in Kürze
3. Docbook als Format
4. Workflow
5. Tools
6. Erfahrungen aus Buch-Konvertierung LaTeX -> XML
7. Manuskripte in andere Formate konvertieren
8. Ausblick
Workflow und Tools


    Jochen
    Hein

Helenenstraße 18
65183
Wiesbaden

0611/7 248 737
  


1. Warum Publishing mit XML?

- Warum das ganze? Eine Source fr verschiedene Ausgabemedien Logisches Markup Einfache Bearbeitung/konvertierung Kein Medienbruch zwischen Pr䳥ntationen, Webseiten und Artikeln/Bchern Kein Vendor-Lock-In Freie Wahl des Ausgabe-Formates


2. XML in Kürze

- XML/XSL Was ist das? W3C-Standards, Beispiele

3. Docbook als Format

- Festlegung auf DocBook Bcher, Manpages, Webseites und Pr䳥ntationen Indutry-strength Standard und kompatibel


4. Workflow

XML/SGML -> XSL/DSSSL -> FO, TEX, RTF, HTML etc. FO -> Passivetex, fop, kommerzielle Tools Kommandozeilen, Automatisierung


5. Tools

Editor: Emacs, OOo? XML-Editoren, WYSIWYG? XSL: xsltproc, saxon CSS: Anzeige von XML im Browser XSL-FO: fop, passivetex Anzeige: Browser, more, Wordview, PDF-Reader Speicher


6. Erfahrungen aus Buch-Konvertierung LaTeX -> XML

Das Original-Manuskript lag in LaTeX mit verschiedenen eigenen Styles vor. Viele LaTeX-Konstrukte, die visuelles Markup verwenden, wurden in eigene Makros gekapselt, deren Name logisches Markup repräsentierte. Mit Hilfe des Tools ltx2x und eigenen Umsetz-Regeln wurde das Manuskript konvertiert.

Dabei waren einige Klippen zu umschiffen:

Für eine dauerhafte Pflege des Dokumentes in LaTeX und das regelmäßige Erzeugen der DocBook-Quellen ist dieses Verfahren nicht geeignet. Für die einmalige Umstellung und die ohnehin erforderliche (inhaltliche) Arbeit mit dem Manuskript war der Aufwand und das Ergebnis angemessen.


7. Manuskripte in andere Formate konvertieren

Verlage verwenden gelegentlich eigene Document-Type-Descriptions. Diese können Ähnlichkeiten zu anderen DTDs enthalten, müssen das aber nicht. Je näher die DTD in der Dokumentenstruktur am Originalformat ist, desto einfacher wird die Konvertierung. Die Umsetzung erfolgt mit Hilfe eines XSLT-Skriptes.

Bei der Publikation bei Addison-Wesley (Pearson Education) kam die verlagseigene Pearson-DTD zum Einsatz. Diese ist in der Struktur Docbook relativ ähnlich, so dass eine erste Konvertierung recht einfach war. Im Detail tauchten dabei jedoch verschiedene Schwierigkeiten auf:

Ich habe mich für Docbook als Quellformat entschieden, weil ich diese DTD schon länger kenne und verwende. In den Original LaTeX-Quellen wurde außerdem logische Markup verwendet, das einfach in DocBook konvertiert werden konnte. Bei einer Umwandlung in das Pearson-Format wäre diese logische Formatierung leider verloren gegangen, da diese DTD eine Mischung zwischen logischem und visuellem Markup abbildet.

Vor der endgültigen Manuskript-Abgabe muss man sicherstellen, dass das in das Pearson-Format umgewandelte Dokument dem Original im DocBook-Format entspricht. Probeausdrucke und Korrekturfahnen wurden daher mit einem eigenen Stylesheet - basierend auf den DocBook-Styles - erstellt. Damit ließ sich die Qualität der Umsetzung, sowohl aus dem LaTeX-Format als auch der Schritt zwischen DocBook und Pearson gut prüfen.


8. Ausblick

Für mich persönlich war der Einsatz von XML in einem größeren Projekt sehr nützlich. Die verfügbaren Tools erfüllten alle ohne Ausnahme ihren Zweck, wenn auch die Java-Tools viel Speicher und damit lange Laufzeiten benötigen.

Bisher frei verfügbare Tools für XML-FO reichen für interne Ausdrucke aus, aber nicht für die Abgabe von druckfertigen Manuskripten. Das Ziel valide Dokumente gemäß der Pearson-DTD zu erzeugen war jedoch mit nur geringem Aufwand zu erreichen.

Damit konnte der eigentliche Satz durch einen professionellen Setzer erfordern, der bereits Erfahrung mit der Verlags-DTD hatte. Basierend auf dem LaTeX-Manuskript hätte der Satz durch den Autor erfolgen müssen - und in den ersten Auflagen wurde klar, dass LaTeX zwar meist gute Ergebnisse liefert, aber manche Dinge nicht einfach zu realisieren sind.

Welche Faktoren bestimmen die Entscheidung?

Das hier vorgestelle Projekt erforderte intensive Kenntnisse in den verschiedenen Tools. Für DocBook existieren eine Reihe von Tools, die auch für Laien einsetzbar sind, manche dieser Tools sind aber kommerzielle.

Tausende Legacy-Dokumente?