HTML vs XML #2

Comme on l’a vu la semaine dernière, le HTML est le langage historique d’Internet. Cependant, il manque de rigueur pour les puristes de l’informatique : le mélange des données et de leurs représentations à l’écran, une syntaxe trop permissive, … Il nécessite des arrangements de la part des développeurs Web pour s’assurer d’un résultat satisfaisant quelque soit le navigateur. Cela ne semble pas suffire. Et un concurrent arrive … le XML.

Le XML ou eXtensible Markup Language, se présente comme un concurrent direct. Il corrige les principaux défauts du HTML et offre des opportunités envisageable pour son challenger. Concrètement, le XML reste un langage à balise. Chaque élément d’une page sont décrits dans des balises. La syntaxe ressemble donc à celle du HTML, en apparence du moins. En effet, sa logique est plus complexe. 

La première règle d’un document XML est que toute balise ouverte doit être fermée. La deuxième règle est que les balises ne doivent pas se chevaucher. La troisième règle est qu’un document XML doit indiquer un document qui décrit sa syntaxe. Rien qu’avec ses trois règles du langage de balisage, on sent que ses géniteurs ne plaisantent pas. Pour avoir un langage performant, il faut de la rigueur et de la rigueur. L’informatique c’est binaire. 

D’ailleurs, l’objectif du XML n’est pas seulement de remplacer le format HTML mais de devenir le langage universel de description des échanges informatiques. Il se destine à remplacer les autres formats de fichiers. 

 Mais pour nos pages Internet, comment faire ? Là où en HTML, il n’est besoin que d’un document, le XML nécessite au moins 3 documents.

Le premier de ses documents reprend le contenu de la page. Il peut être vu comme une base de données. Votre page contient un titre et deux paragraphes, vous aurez la structure suivante :

Le deuxième document décrit la structure du premier document. On parle de XSD (XML Schema Définition) Il définit chaque balise : structure, itération, cardinalités, … Il indique la hiérarchie des balises entre elles. Ce document peut être lui-même décrit par un autre document ou respecter une description standardisée.

Le troisième document permet de transformer le premier document pour l’adapter à son support. On parle de feuille de transformation (XSLT – eXtensible Stylesheet Language Transformation). Ainsi, suivant le support où doit apparaître le site, la feuille de transformation donne les consignes pour l’afficher dans les meilleures dispositions. Un même document XML peut s’afficher sur un écran d’ordinateur ou de smartphone, sur une imprimante ou sur un panneau d’affichage numérique. 

Cette logique permet au XML de s’imposer sur de nombreux domaines : flux RSS, échanges entre services Internet, documents et tableurs, bases de données, … son adoption est massive. De plus, de nombreux services sont créés pour faciliter son adoption dans les applications informatiques.

Face à une telle débauche de talents, le HTML se sent condamné. Imaginez Edward Norton de Fight Club qui se retrouve face à la bande des Expendables. Le combat s’annonce inégal. La suite au prochain épisode.

Partager l'article !!

J’ai de la chance !!!