Les Balises
Si vous connaissez déjà l'HTML, il sera facile de s'adapter. XML est néanmoins un langage de balisage plus strict que le HTML, par exemple :
toute balise ouverte doit être fermée. Ceci est souvent source d'erreur en XML, alors autant prendre de bonnes habitudes au départ.
Notation :
<element>valeur de l'élément</element>
Exemple :
<telephone>04.00.00.00.00</telephone>
Element Vide
On désigne en XML "l'élément vide" tout élément dont le contenu ("valeur de l'élément") est vide.
Notation :
<elementvide></elementvide>
ou
<elementvide />
Exemple d'éléments vides :
<img src="toto.gif"></img> est un élément vide
ou encore
<hreference ul="http://www.asp-magazine.com" />
Le noms des éléments
Les noms des éléments doivent se soumettre à plusieurs règles :
là encore les noms sont souvent une source d'erreur.
- 1- Respecter la casse
la notation <Adresse></ADRESSE> est incorrecte, en effet le XML est sensible à la casse. Pour corriger la notation employée précédément, on écrira :
<adresse></adresse>
Par convention, on écrira le nom des éléments toujours en minuscule.
- 2- Les caractères non autorisés
<telephone personnel></telephone personnel> est incorrect en XML
on écrira :
<telephone-personnel></telephone-personnel>
3- Les caractères autorisés
La ponctuation : "-" , ":" , "_" , "."
Les caractères alphabétiques accentués ou pas : "a" , "A" , "é" , etc...
Les caractères numériques : "1", "2", "3" etc..
4- La première lettre du nom
- Le nom d'un élément commence toujours par une lettre ou un des caractères de ponctuation suivant : "-", ":","_","."
Note : Même s'il est possible de l'utiliser, évitez l'emploi du ":" (deux points) car il est réservé pour les espaces de noms (nous y reviendrons plus tard)
Exemple :
<toto></toto> est correct
<1toto></1toto> est incorrect
- 5- Les noms commençant par "xml" ou par n'importe quel caractères "X" ou "x", "M" ou "m", "l" ou "L" sont à éviter car ils sont réservés à des fins de normalisation du langage.
Pour respecter cette norme, vous devez vous fixer des conventions au départ :
Par exemple :
Je remplacerais l'espace par un tiret : <tel-personnel>
ou je mettrais une majuscule a chaque début de nouveau mot : <TelPersonnel>
ou autre ...
Le tout étant d'éviter des mélanges de plusieurs conventions au sein d'un même fichier , et de rester compatible avec les normes à venir ...
La racine du document
Tout document XML doit contenir une racine : Un élément parent qui "chapeaute" l'ensemble des autres éléments du document.
Exemple :
<?xml version "1.0"?>
<news>
<titre>Valider une adresse email</titre>
<date-parution>17/11/00</date-parution>
<auteur />
</news>
<news>
<titre>Envoyer un fichier par mail</titre>
<date-parution>10/11/00</date-parution>
<auteur />
</news>
est incorrect
La version correcte du code précédent, est la définition d'une racine qui chapeaute l'ensemble du document :
<?xml version "1.0"?>
<aspmag-news>
<news>
<titre>Valider une adresse email</titre>
<date-parution>17/11/00</date-parution>
<auteur />
</news>
<news>
<titre>Envoyer un fichier par mail</titre>
<date-parution>10/11/00</date-parution>
<auteur />
</news>
</aspmag-news>
est correct.
Dans l'exemple précédent aspmag-news est l'élément parent du document.
Il ne peut exister qu'un élément parent par document.
Les commentaires
Tout langage qui se respecte, dispose d'une norme de nommage pour les commentaires : les commentaires sont toujours ignorés des compilateurs, et sont simplement placés par le programmeur à "titre de documentation du code".
Notation :
<!-- Ceci est un commentaire -->
Le codage des caractères : Unicode
L'écriture des caractères XML se conforme à la norme UNICODE, norme développée afin de facilité l'internationalisation des fichiers écrits.
http://www.unicode.com
Nous utiliserons dans nos fichiers XML la norme ISO 8859-1qui correspond aux langues d'Europe occidentale (Latin-1), ce qui permet d'utiliser la plupart des accentuations possibles.
Déclaration de fichier XML écrit en Latin-1 :
<?xml version="1.0" encoding="ISO-8859-1"?>