Jochen
Hein
Helenenstraße 18
65183
Wiesbaden
<jochen@jochen.org>
0611/7 248 737
- Warum das ganze? Eine Source fr verschiedene Ausgabemedien Logisches Markup Einfache Bearbeitung/konvertierung Kein Medienbruch zwischen Pr䳥ntationen, Webseiten und Artikeln/Bchern Kein Vendor-Lock-In Freie Wahl des Ausgabe-Formates
- Festlegung auf DocBook Bcher, Manpages, Webseites und Pr䳥ntationen Indutry-strength Standard und kompatibel
XML/SGML -> XSL/DSSSL -> FO, TEX, RTF, HTML etc. FO -> Passivetex, fop, kommerzielle Tools Kommandozeilen, Automatisierung
Editor: Emacs, OOo? XML-Editoren, WYSIWYG? XSL: xsltproc, saxon CSS: Anzeige von XML im Browser XSL-FO: fop, passivetex Anzeige: Browser, more, Wordview, PDF-Reader Speicher
Das Original-Manuskript lag in LaTeX mit verschiedenen eigenen Styles vor. Viele LaTeX-Konstrukte, die visuelles Markup verwenden, wurden in eigene Makros gekapselt, deren Name logisches Markup repräsentierte. Mit Hilfe des Tools ltx2x und eigenen Umsetz-Regeln wurde das Manuskript konvertiert.
Dabei waren einige Klippen zu umschiffen:
Umlaut "Ö" führte dazu, dass das Tool in eine Endlos-Schleife geriet. Mit Hilfe eines sed-Skriptes wurden Umlaute durch LaTeX-Makros ersetzt und diese passend konvertiert.
Makros, für die noch keine Konvertierungsregeln angelegt wurde, werden still und leise ignoriert. Eine manuelle Prüfung der entstehenden XML-Datei ist damit unbedingt notwendig - möglichst bevor manuelle Änderungen durchgeführt werden.
Bei der Konvertierung der Tabellen war eine einfach Makro-Ersetzung nicht ausreichend. Durch einige Makros ließen sich manuelle Änderungen aber auf das Löschen überflüssiger Tags beschränken.
Für eine dauerhafte Pflege des Dokumentes in LaTeX und das regelmäßige Erzeugen der DocBook-Quellen ist dieses Verfahren nicht geeignet. Für die einmalige Umstellung und die ohnehin erforderliche (inhaltliche) Arbeit mit dem Manuskript war der Aufwand und das Ergebnis angemessen.
Verlage verwenden gelegentlich eigene Document-Type-Descriptions. Diese können Ähnlichkeiten zu anderen DTDs enthalten, müssen das aber nicht. Je näher die DTD in der Dokumentenstruktur am Originalformat ist, desto einfacher wird die Konvertierung. Die Umsetzung erfolgt mit Hilfe eines XSLT-Skriptes.
Bei der Publikation bei Addison-Wesley (Pearson Education) kam die verlagseigene Pearson-DTD zum Einsatz. Diese ist in der Struktur Docbook relativ ähnlich, so dass eine erste Konvertierung recht einfach war. Im Detail tauchten dabei jedoch verschiedene Schwierigkeiten auf:
Anhänge
<xsl:template match="appendix[1]">
<appendix>
<chapter>
<xsl:call-template name="transform.id.attribute"/>
Index
Bibliographie
xref: Texterzeugung
Ich habe mich für Docbook als Quellformat entschieden, weil ich diese DTD schon länger kenne und verwende. In den Original LaTeX-Quellen wurde außerdem logische Markup verwendet, das einfach in DocBook konvertiert werden konnte. Bei einer Umwandlung in das Pearson-Format wäre diese logische Formatierung leider verloren gegangen, da diese DTD eine Mischung zwischen logischem und visuellem Markup abbildet.
Vor der endgültigen Manuskript-Abgabe muss man sicherstellen, dass das in das Pearson-Format umgewandelte Dokument dem Original im DocBook-Format entspricht. Probeausdrucke und Korrekturfahnen wurden daher mit einem eigenen Stylesheet - basierend auf den DocBook-Styles - erstellt. Damit ließ sich die Qualität der Umsetzung, sowohl aus dem LaTeX-Format als auch der Schritt zwischen DocBook und Pearson gut prüfen.
Für mich persönlich war der Einsatz von XML in einem größeren Projekt sehr nützlich. Die verfügbaren Tools erfüllten alle ohne Ausnahme ihren Zweck, wenn auch die Java-Tools viel Speicher und damit lange Laufzeiten benötigen.
Bisher frei verfügbare Tools für XML-FO reichen für interne Ausdrucke aus, aber nicht für die Abgabe von druckfertigen Manuskripten. Das Ziel valide Dokumente gemäß der Pearson-DTD zu erzeugen war jedoch mit nur geringem Aufwand zu erreichen.
Damit konnte der eigentliche Satz durch einen professionellen Setzer erfordern, der bereits Erfahrung mit der Verlags-DTD hatte. Basierend auf dem LaTeX-Manuskript hätte der Satz durch den Autor erfolgen müssen - und in den ersten Auflagen wurde klar, dass LaTeX zwar meist gute Ergebnisse liefert, aber manche Dinge nicht einfach zu realisieren sind.
Welche Faktoren bestimmen die Entscheidung?
Das hier vorgestelle Projekt erforderte intensive Kenntnisse in den verschiedenen Tools. Für DocBook existieren eine Reihe von Tools, die auch für Laien einsetzbar sind, manche dieser Tools sind aber kommerzielle.
Tausende Legacy-Dokumente?