Lenguajes de marcado más comunes en la edición

El primer acercamiento que se tendrá para el cuidado y formateo del texto será mediante lenguajes de marcado. Sin embargo, ¿qué son los lenguajes de marcado? ¿Cómo se usan? ¿Qué posibilidades tenemos?

Logotipo de Markdown.
Logotipo de Markdown.

Recursos

  1. What is EPUB 3?.

  2. «The ultimate guide to Markdown».

  3. «Guía para Markdown en PDF».

Lenguajes de marcado

Existen varios tipos de lenguajes de marcado: los ligeros, los pesados y los pensados como notación de objetos para el intercambio de datos.

Markdown

El lenguaje de marcado ligero más popular es, sin dudas, Markdown, el cual es:

Ventajas:

Desventajas:

Debido a que usa un enfoque WYSIWYM («lo que ves es lo que quieres decir»), no es común en el ámbito editorial. Requiere el aprendizaje de algo nuevo; a saber, su sintaxis.

                Formato | Tipo    | Programa usual  | LicenciaMD      | Abierto | Editor de texto | Variable
            

Ejemplo:

                # Encabezado 1Esto es un párrafo con una *itálica*.## Encabezado 2> Bloque de cita con una **negrita**.
            

Familias TeX y HTML

De lenguajes de marcado pesado tenemos la familia de TeX y la familia HTML.

                Formato | Tipo    | Programa usual  | LicenciaTeX     | Abierto | Editor de texto | VariableHTML    | Abierto | Editor de texto | Variable
            

Ejemplo de TeX:

                \begin{document}\chapter{Encabezado 1}Esto es un párrafo con una \textit{itálica}.\section{Encabezado 2}\begin{quote}  Bloque de cita con una \textbf{negrita}.\end{quote}\end{document}
            
Entorno de trabajo con TeX con TeXstudio.
Entorno de trabajo con TeX con TeXstudio.

Ejemplo de HTML:

                <!DOCTYPE html><html>  <body>    <h1>Encabezado 1</h1>    <p>Esto es un párrafo con una <em>itálica</em>.</p>    <h2>Encabezado 2</h2>    <blockquote>Bloque de cita con una      <strong>negrita</strong>.</blockquote>  </body></html>
            

XML, JSON y YAML

Cuando se requiere un manejo de datos para archivos de consulta o generación dinámica de contenido, la notación de objetos es la opción más pertinente.

Es el XML el formato más dominante, pero también el de más difícil lectura y escritura al formar parte de la familia HTML.

Ejemplo de XML:

                <?xml version="1.0" encoding="UTF-8" ?><publication>  <content>    <h1>Encabezado 1</h1>    <p>Esto es un párrafo con una <em>itálica</em>.</p>    <h2>Encabezado 2</h2>    <blockquote>Bloque de cita con una      <strong>negrita</strong>.</blockquote>  </content></publication>
            

Ante esta dificultad, existe una notación más ligera para los mismos fines que es JSON.

Ejemplo de JSON:

                {  "publication" : {    "content" : {      "h1": "Encabezado 1",      "p": "Esto es un párrafo con una <em>itálica</em>.",      "h2": "Encabezado 2",      "blockquote": "Cita con <strong>negrita</strong>."    }  }}
            

Sin embargo, como es perceptible, la estructura de un archivo JSON puede ser muy confusa, por lo que YAML surge como una solución a este problema.

Ejemplo de YAML:

                ---publication:  content:    h1: "Encabezado 1"    p: "Esto es un párrafo con una <em>itálica</em>."    h2: "Encabezado 2"    blockquote: "Cita con <strong>negrita</strong>."
            
                Formato | Tipo    | Programa usual  | LicenciaXML     | Abierto | Editor de texto | VariableJSON    | Abierto | Editor de texto | VariableYAML    | Abierto | Editor de texto | Variable
            

Editores de texto

Los lenguajes de marcado más populares son formatos abiertos, esto permite que puedan ser redactados desde cualquier tiepo de editor de textos, privados, abiertos o libres. Los editores recomendados para poder escribir cualquiera de estos formatos son:

                Programa     | Licencia    | PlataformaGeany        | Libre       | MultiplataformaGedit        | Libre       | MultiplataformaAtom         | Libre       | MultiplataformaBrackets     | Libre       | MultiplataformaSublime Text | Propietaria | MultiplataformaDreamweaver  | Propietaria | Windows y macOS
            

Familia EPUB

Las tres capas de una publicación electrónica.
Las tres capas de una publicación electrónica.

Con el fin de tener un formato específico para la lectura a través de una pantalla, que a su vez fuese estandarizado y abierto, surge el EPUB.

¿Qué es un EPUB?

  1. Es un conjunto de archivos XHTML comprimidos para su portabilidad.

  2. Incluye metadatos y tabla de contenidos.

  3. Permite una lectura «líquida» del contenido.

  4. Es un formato abierto y estandarizado.

  5. Es el formato base para otros pares privativos como AZW o IBOOKS.

  6. Fue desarrollado por International Digital Publishing Forum (IDPF).

  7. Surge a partir del Open eBook Publication Structure (OEBPS).

  8. La primera versión, la 2.0, fue liberada en septiembre del 2007.

  9. En enero del 2017 IDPF pasó a formar parte del World Wide Web Consortium, al mismo tiempo que liberó la versión 3.1 del EPUB; sin embargo, la mayoría de los distribuidores solo aceptan la versión 3.0.0.

Pese a que el EPUB es el formato estándar, diversas corporaciones han creado sus propios formatos cerrados a partir del EPUB u OEBPS, como:

La decisión de un formato cerrado puede ser por 1) intereses comerciales, 2) optimización en los dispositivos, 3) adición de DRM o 4) implementación de características no estandarizadas.

                Formato | Tipo        | Programa usual | LicenciaEPUB    | Abierto     | Renderizador   | VariableIBOOKS  | Propietario | iBooks         | PropietariaMOBI    | Propietario | Familia Kindle | PropietariaAZW3    | Propietario | Familia Kindle | Propietaria
            

Estilos Markdown de Pecas

La sintaxis básica de Markdown o la extendida por Pandoc carecen de varios elementos necesarios para el quehacer editorial. Esto se debe a que Markdown nació para la escritura rápida de blogs, no para la creación de publicaciones digitales.

Gracias a la herramienta de base que se utilizará para la creación de libros —Pecas— es posible añadir estilos adicionales que modificarán el archivo automáticamente después de haber sido convertido con Pandoc. Los estilos son los siguientes.

Etiquetas

En diseño, los cambios más relevantes en las etiquetas son:

Clases

Lo más destacado de la hoja de estilos por defecto es la posibilidad de usar diversas clases comunes a un libro:

Existen más clases, pero por el momento son menos relevantes.

Uso en Markdown

Con pc-pandog —la herramienta de conversión de Pecas cuya base es Pandoc— es posible agregar estilos de párrafo al colocar al final de cada párrafo unas llaves con los estilos o identificadores deseados. Por ejemplo, este Markdown:

                Esto es un párrafo que continúaaquí y se quiere a la derecha. {.derecha}Este es otro párrafo al que se leañaden dos clases, *un espacio arriba*y **centrado**. {.espacio-arriba1 .centrado}Pero también es posible añadiridentificadores y clases, como*una sangría francesa* que seidentifique como `p01`. {.frances #p01}
            

Generará este HTML si se usa pc-pandog:

                <p class="derecha">Esto es un párrafo que continúa aquí  y se quiere a la derecha.</p><p class="centrado espacio-arriba1">Este es otro  párrafo al que se le añaden dos clases, <em>un  espacio arriba</em> y <bold>centrado</bold>.</p><p id="p01" class="frances">Pero también es posible  añadir identificadores y clases, como <em>una sangría  francesa</em> que se identifique como  <code>p01</code>.</p>
            

Parece una nimiedad, pero con esta posibilidad ¡ya es posible asignar estilos de párrafo!