4.1. Características del lenguaje
Comentarios
Los comentarios en los documentos XML empiezan por <!-- y acaban por -->.
Pueden contener cualquier cadena de texto excepto el literal --.
Pueden colocarse en cualquier parte del documento.
Ej:
<!-- Esto es comentario <ñññññ-d#dd -->
Secciones CData
Le indican al parser que ignore todos los caracteres de marcas que se encuentren en el interior de esta/s sección/es. (ed, son como comentarios a lo bestia)
Son muy útiles cuando queremos (x ej. a modo de tutorial) visualizar código XML como parte del texto.
Todos los caracteres que existan entre son pasados directamente a la aplicación sin interpretación.
El único literal q no puede ser utilizado dentro de la sección es, lógicamente, el ]]>.
Ej.
<![CDATA[ <!ENTITY amp "&"> <!-- &= ampersand -->
<CODIGO>
*p=&q->campo;
a=(x<y)?33:44;
</CODIGO>
]]>
Elementos
Son las etiquetas más frecuentemente utilizadas dentro de un documento XML.
Están delimitadas por los símbolos < y >, sintaxis de todos conocida, puesto q era la usada en HTML.
Si el contenido de la etiqueta es vacío (al igual q <BR> ó <IMG> en HTML), entonces se delimitan por los símbolos < y />.
Las etiquetas de apertura (las que empiezan por >) pueden incluir atributos, los cuales son pares nombre/valor al estilo color="verde". (x ej, en HTML <font color="green">).
OJO!! En XML los atributos siempre deben ir encerrados entre comillas dobles.
Ejs:
<nombre id="surname">Perez</nombre>
<vacia color="verde"/>
Referencias a entidades
Las entidades(entity) se usan en XML básicamente como representación alternativa de los caracteres especiales (como por ejemplo las comillas dobles ó la marca de apertura en un elemento), aunque también pueden emplearse para incluir el contenido de otros documentos ó para hacer referencia a trozos de texto repetitivos.
Sintaxis: &xxx; donde xxx es el nombre de la entidad, y , &xxx; es la manera de referirse a la entidad.
Ej: é ----> Representa al símbolo é.
Existe una referencia a entidades "especial", denominada referencia a caracteres.
Ésta se usa para representar caracteres que no pueden ser escritos desde el teclado.
No tienen un nombre de cadena (como eacute x ej) sino q su nombre es, ó un nº decimal, ó un nº hexadecimal.
Ej: & <!-- Ampersand -->
Tambien se pueden crear constantes (ó macros) para que no nos tengamos q acordar de los numeross.
Para ello usamos la definición "real" de entidad:
Ej:
<!ENTITY amp "&">
Para referenciarlo: &
Tiene una sintaxis extremadamente sencilla.
Dicen que el XML es un 10% del SGML y de verdad lo es, porque en realidad las normas que tiene son muy simples. Se escribe en un documento de texto ASCII, igual que el HTML y en la cabecera del documento se tiene que poner el texto
<?xml version="1.0"?>
En el resto del documento se deben escribir etiquetas como las de HTML, las etiquetas que nosotros queramos, por eso el lenguaje se llama XML, lenguaje de etiquetas extendido. Las etiquetas se escriben anidas, unas dentro de otras.
<ETIQ1>...<ETIQ2>...</ETIQ2>...</ETIQ1>
Cualquier etiqueta puede tener atributos. Le podemos poner los atributos que queramos.
<ETIQ atributo1="valor1" atributo2="valor2"...>
Los comentarios de XML se escriben igual que los de HTML.
<!-- Comentario -->
Y esto es todo lo que es el lenguaje XML en si, aunque tenemos que tener en cuenta que el XML tiene muchos otros lenguajes y tecnologías trabajando alrededor de él. Sin embargo, no cabe duda que la sintaxis XML es realmente reducida y sencilla.
Para definir qué etiquetas y atributos debemos utilizar al escribir en XML tenemos que fijarnos en la manera de guardar la información de una forma estructurada y ordenada. Por ejemplo, si deseamos guardar la información relacionada con una película en un documento XML podríamos utilizar un esquema con las siguientes etiquetas.
<?xml version="1.0"?>
<PELICULA nombre="El Padrino" año=1985>
<PERSONAL>
</DIRECTOR nombre="Georgie Lucar">
</INTERPRETE nombre="Marlon Brando" interpreta-a="Don Corleone">
</INTERPRETE nombre="Al Pacino" interpreta-a="Michael Corleone">
</PERSONAL>
</ARGUMENTO descripción="Pelicula de mafias sicilianas en Estados Unidos">
</PELICULA>
Como podéis ver, nos hemos inventado las etiquetas que nos venían en gana para poner este ejemplo y las hemos anidado de manera que la etiqueta más grande es la PELICULA y dentro de ella tenemos el PRESONAL y el ARGUMENTO. A su vez, dentro de PERSONAL tenemos tanto al DIRECTOR como a los actores (INTERPRETE).