Inicio » Blog » ¿Qué clase de editor eres tú que no sabes XML?
28/09/2018

¿Qué clase de editor eres tú que no sabes XML?

Mientras tanto, un pato nadaba feliz en el estanque que había en medio del prado.
El pajarito voló acercándose al estanque y, levantando las alas, le dijo al pato:
−¿Qué clase de pájaro eres tú, que no sabes volar?
−¿Y qué clase de pájaro eres tú, que no sabes nadar? −replicó el pato sumergiéndose en el agua.

Serguéi Prokófiev, Pedro y el Lobo

 

 

Ya hemos insistido en otra ocasión en la importancia de pensar en digital cuando planteamos la maquetación de una publicación, es decir, no pensar en un formato concreto, sino precisamente abstraernos de cualquier formato final y trabajar con el contenido desnudo. De esta forma resulta más fácil generar después diferentes formatos partiendo del mismo contenido al no estar este mezclado con las características que definen la forma en que debe visualizarse.

Esto es fundamental en un momento en que un mismo libro, un artículo o un lema de diccionario ya no tiene un único soporte, sino que puede distribuirse en papel y en formato digital, y en cada uno de estos soportes puede hacerlo a su vez de diferentes formas. Preparar un texto expresamente para un formato o variedad concreta cuando se hace necesario contar con la misma información en múltiples formatos no parece la forma más eficiente de trabajar actualmente. Si desde el principio mezclamos el contenido con su formato para dar lugar a un producto final será más difícil recuperar el contenido puro para iniciar un nuevo proceso de maquetación para otro formato final. Además de duplicar el proceso de trabajo tenemos nuevas posibilidades de introducir errores, y si una vez publicado necesitamos añadir correcciones o actualizaciones habrá que repetirlas en cada una de sus versiones y variedades.

Por eso, la mejor forma de trabajar en un mundo digital en el que los contenidos se ofrecen al lector de forma tan diversa es definir claramente cada uno de los elementos que lo forman, pero sin añadirles formato alguno. De esta manera, de cara a actualizar nuestras publicaciones podemos corregir erratas, añadir nueva información, etc. sin preocuparnos de modificar el aspecto ni tocar las diferentes versiones. Tener el contenido "desnudo" en un repositorio  que nos permita actualizarlo y ampliarlo para después partir de él para generar diferentes versiones (a veces con procesos casi automáticos) no es una utopía, porque para ello existe desde hace muchos años el lenguaje XML.

XML está pensado precisamente para organizar los contenidos de acuerdo únicamente a su semántica y no a su formato. Además es un lenguaje compatible con todas las plataformas y permite su procesamiento de diversas maneras para generar formatos finales diferentes. Por otra parte tiene la versatilidad suficiente para adaptarse a cualquier tipo de material, ya que se pueden crear las etiquetas que sean necesarias en cada caso para dar estructura semántica a cualquier contenido, por muy complejo que sea.

Por ejemplo, encabezando este texto hemos reconocido que hay una cita porque visualmente está escrita con una letra más pequeña, tiene una sangría izquierda y, para colmo, acaba con el nombre de un autor seguido del título de una obra en cursiva. Pero está en un formato concreto (en este caso HTML) y con una representación visual que reconocemos porque tradicionalmente las citas se presentan así en nuestra cultura. Pero seguiría siendo una cita aunque el aspecto no fuera ese, porque como muy bien nos recuerda Machado, «el ojo que ves no es ojo porque tú lo veas; es ojo porque te ve». 

Por eso, más importante que su aspecto final —pues podría ser otro— lo fundamental es que se pueda identificar semánticamente como una cita. Para ello bastaría con que el texto estuviera etiquetado, por ejemplo, con la etiqueta <CITA>. Por supuesto, dado que esta cita está formada por varios párrafos, cada uno de ellos necesitará también una etiqueta, por ejemplo la etiqueta <P>, o incluso, ya  que es un diálogo, podría interesarnos inventar las etiquetas <NARRADOR>, <PATO> y <PAJARO>. Para el nombre del autor podríamos usar la etiqueta <AUTOR>, que a su vez podría contener las etiquetas <NOMBRE> y <APELLIDO>, pues no siempre es fácil distinguir solo con los ojos dónde acaba el nombre y dónde empieza el apellido (por ejemplo si hubiéramos usado el larguísimo nombre completo de Prokófiev). Asimismo el titulo de la obra podría ir marcado con la etiqueta <OBRA>.

Como vemos, no es nada difícil etiquetar ese texto para definir qué función o sentido tiene cada elemento, y al tenerlo así etiquetado tampoco es difícil que con un proceso más o menos automático —por ejemplo asignando etiquetas a estilos en inDesign—, pudiéramos darle este mismo formato final que vemos. Pero también, si más adelante es necesario cambiarlo o adaptarlo para su visualización en diferentes dispositivos, será más fácil hacerlo al tener separado contenido y formato. La cita, el texto, el contenido permanecerá siempre correctamente etiquetado permitiendo reconocer cada uno de sus elementos sin necesidad de vincularles un formato concreto. Y, precisamente por eso, darle visualizaciones concretas resultará mucho más fácil que si lo tenemos ya formateado, por ejemplo en un documento de procesador de texto.

Pero es más. ¿Que clase de obra es Pedro y el lobo? Puede que nos interese añadir que se trata de un cuento sinfónico o indicar el estilo o la época a la que pertenece. En ese caso, a la etiqueta <OBRA> podremos añadirle atributos y delimitar (o no) qué valores concretos puede tener. De esta forma, podemos también añadir múltiple información a nuestros datos, bien sea para que se refleje de una determinada forma en su visualización final o simplemente para facilitar el procesamiento de esa información de forma automática para búsquedas, comparaciones, etc.

calamoycran-cita

Etiquetas y atributos pueden definirse previamente para adaptarse a las circunstancias de lo que queremos etiquetar de forma que XML es en realidad un metalenguaje, pues nos da la libertad de crear nuevas etiquetas organizadas para estructurar cualquier tipo de contenido y para cualquier fin que necesitemos. Pero también, cuando es necesario, se pueden estandarizar estos conjuntos en normas para tipos de contenidos determinados, lo que permite crearlos de acuerdo a una estructura común para así ser mejor intercambiados, procesados, indexados, etc. Por ejemplo, XHTML es una norma XML que recoge el conjunto de etiquetas y atributos que se utilizan para maquetar un documento web.

Cada día más materiales se organizan en XML precisamente para eso. La mayoría de las revistas científicas se publican hoy día principalmente en digital, no solo por el mayor coste del papel, sino también por su mayor versatilidad en la distribución y su facilidad para la indexación, tan importante en el entorno académico y científico. Aunque para su lectura final se utilice PDF o la propia página web, tener el documento estructurado en XML permite ese mejor procesamiento de sus datos y también el que, mediante hojas de estilo XSLT u otras aplicaciones, se puedan generar diferentes formatos finales, como PDF, HTML o ePub.

Todo esto puede parecer que pertenece al mundo de los informáticos, que son quienes trabajan con código, pero nada más lejos de la realidad, porque precisamente XML es un lenguaje sencillo (aunque complicable, como todos) que es fácil de usar y que en el fondo no está lejos de los lenguajes de marca que se usaban en artes gráficas para maquetar antes de la autoedición, por lo que precisamente a editores y maquetadores no debería resultarnos ajeno.

Con la integración del mundo digital en el ámbito  de la publicación es evidente que el marcado semántico de los contenidos es una labor que se irá paulatinamente integrando en el proceso editorial. En un futuro no muy lejano (porque ya es así en ciertos entornos) los autores entregarán sus textos etiquetados y los editores colaborarán  con ellos en ese proceso, definiendo el etiquetado apropiado y revisando el trabajo de los autores. Por su parte, los maquetadores integrarán también los documentos XML en su proceso de trabajo para generar las versiones finales para papel y digital.

Eso será lo habitual en un futuro no muy lejano, pero ya lo es hoy para determinados tipos de contenido como el que hemos mencionado de los artículos científicos, pero también para el material educativo que se presenta igualmente en libros de texto en papel pero también en forma de aplicaciones digitales o publicaciones online para su consulta.

Los editores deben ser capaces de trabajar con el material estructurado en XML a través de aplicaciones específicas para gestionar estos documentos, y los maquetadores deben saber automatizar parte del proceso de maquetación partiendo de contenido ya etiquetado en vez de contenido formateado. 

Programas como InDesign permiten trabajar con XML tanto para generar maquetas a partir de un documento XML como para etiquetar y generar XML a partir de otro tipo de documentos.

Y eso es precisamente lo que veremos en el curso de Maquetación en XML con InDesign, tanto en analógico, en las aulas de Cálamo y Cran, como en digital en su campus virtual, pues, como veis, ya casi nada se ofrece de un única forma. Conoceremos la sintaxis básica del lenguaje XML, pero sobre todo nos centraremos en cómo podemos integrarlo en nuestro proceso de maquetación con InDesign para poder asociar un formato a esos contenidos y generar maquetas a las que solo quedará realizar el ajuste necesario para adaptarlo a su soporte final, sea este papel o digital.

Y es que no hay que elegir, como las aves del cuento de Prokófiev, entre nadar o volar, sino que podemos trabajar en tierra firme precisamente para permitir que nuestros contenidos echen a volar o nadar según lo necesiten.

¿Quieres seguir aprendiendo?

Curso de Maquetación en XML con InDesign
Curso de Maquetación digital
Cursos de Edición
Cursos de Diseño y maquetación

Autor

Valentín PérezProfesor de eBook y editor
Compartir