Initiation à XML - www.cti-formation.com www.asp-php.net By F.Remise alias Derf
Initiation à XML - www.cti-formation.com www.asp-php.net By F.Remise alias Derf © <Derf:XML easy="true"> <Derf:title part="1"> Initiation à XML </Derf:title> </Derf:XML> By F.REMISE Microsoft MVP derf@asp-php.net Initiation à XML - www.cti-formation.com www.asp-php.net By F.Remise alias Derf © 2 / 6 INTRODUCTION W3C : XML a été conçu pour être facile à mettre en œuvre et interopérable avec SGML et HTML. MSDN : Le XML est le format universel de données pour le Web. A ceux que ces affirmations laissent rêveur, je propose un voyage initiatique au cœur de XML dont la première étape commence ici. Beaucoup d'entre vous, bercés par le chant des sirènes, se seront aventurés dans les méandres de XML pour en ressortir complètement démoralisés au vu des différents standards et spécifications constituant la bête. Je vous propose ici de refaire le voyage accompagné d'un guide composé de 10 chapitres : XML Part 1 : Document bien formé XML Part 2 : Document valide 1 : DTD et définition d'éléments XML Part 3 : Document valide 2 : DTD et définition d'attributs et d'entités XML Part 4 : Namespaces et DataIsland XML Part 5 : Mise en forme et affichage d'un doc XML : CSS XML Part 6 : Mise en forme et affichage d'un doc XML : DataBinding avec DSO XML Part 7 : Mise en forme et affichage d'un doc XML : DOM XML XML Part 8 : Mise en forme et affichage d'un doc XML : XSL/XSLT et XPath XML Part 9 : XML Schema XML Part 10 : Autres standards et spécifications pour XML Avant de poursuivre la lecture de cet article, assurez-vous d'être en pleine possession de la pratique et des connaissances nécessaires et suffisantes pour HTML/XHTML, CSS, JavaScript/JScript et sur l'architecture générale du Web. XML : KESAKO ? Autant le dire tout de suite, XML n'est pas le remplaçant de HTML; L'évolution de HTML est plutôt à voir en XHTML. XML et HTML sont complémentaires. XML (eXtensible Markup Language) est une spécification proposée par le W3C (World Wide Web Consortium) en 1998. XML, tout comme HTML, est issu de SGML (Standardized Generalized Markup Language). XML est un métalangage pouvant servir de base pour la définition d'autres langages (SMIL utilisé en vidéo, WML utilisé pour le WAP, MathML etc...). Certains éléments constituant cette initiation seront abordés succinctement, soit parce qu'ils font partie d'un autre module de formation soit parce qu'ils débordent du cadre initiatique de ce support. Les avantages de XML XML permet de définir ses propres balises et ses propres attributs. Il est donc plus flexible que HTML qui, lui, ne possède qu'un nombre limité de balise. Un document XML peut être validé par des règles strictes, contenues par des DTD ou des Schémas, décrivant sa structure et la hiérarchisation de ses données. Les informations ainsi que le traitement de la mise en forme sont rigoureusement séparés de la structure du document XML. Initiation à XML - www.cti-formation.com www.asp-php.net By F.Remise alias Derf © 3 / 6 XML est un format standardisé ouvert ne nécessitant aucune licence, intégralement basé texte et qui peut être associé à n'importe quel jeu de caractères. De plus en plus d'applications utilisent le format XML; C'est le cas de certains SGBD mais aussi d'outils de bureautique comme Microsoft Office 2003 ou Sun Open Office. XML est également au cœur de la nouvelle plate-forme de développement de Microsoft : .NET. Enfin, son interopérabilité et le fait que de grands acteurs de l'informatique dont IBM, Microsoft et Sun préconisent l'utilisation d'XML, font que XML pourrait bien être l'avenir des systèmes GED comme l'EDI ou le B to B. Les inconvénients de XML Le principal inconvénient, à mon sens, pourrait venir du format lui même : le format texte; Les données stockées au format texte sont en général plus volumineuses que celles stockées au format binaire. Du point de vue purement Web, on peut également mentionner le fait qu'il est impossible d'utiliser du XML pur pour créer les pages d'un site sans l'associer à d'autres langages (que nous aborderons, pour certains, dans cet série d'article) tel que HTML, CSS, XSLT, Scripts DOM ou encore ASP.Net. Contrairement aux "validateurs" HTML plutôt permissifs, les "validateurs" XML sont dénués de tout laxisme; Mais est-ce vraiment un inconvénient quand on vise l'interopérabilité ? En résumé Le format XML n'enregistre que les données textuelles et la structure des données un peu comme un base de données. Il peut donc être particulièrement utile pour des données structurées de type : liste de produits, carnet d'adresses, etc... XML est un métalangage à la grammaire stricte. Cela s'exprime par le respect de la casse, la fermeture de chaque balise ouverte, l'encadrement par des guillemets des valeurs d'attributs, l'échappement des caractères spéciaux, les balises ne peuvent être entrelacées. C'est un standard ouvert, basé texte, de plus en plus diffusé et complètement interopérable ce qui le rend, de fait, idéal pour le stockage de fichiers à long terme et lui attribut un rôle important dans la gestion électronique de document et l'échange de données informatisées. STRUCTURE D'UN FICHIER XML DE BASE : DOCUMENT BIEN FORME Document bien formé (well-formed) Un document XML est dit "bien formé" (well-formed) s'il est constitué d'un prologue et d'un élément racine (nœud racine). Pour l'ensemble de mes démonstrations, je prendrai comme exemple la gestion des ouvrages d'une librairie spécialisée dans les livres informatiques. Le prologue Il s'agit de la ligne d'introduction d'un document XML. Cette ligne est obligatoire pour avoir un document considéré comme "bien formé". Il est impératif de respecter la casse de cette ligne. <?xml version="1.0" encoding="iso-8859-1" standalone="no"?> Cette ligne permet donc d'indiquer la version XML utilisée, le jeu de caractères utilisé et l'autonomie du document. L'autonomie d'un document XML est lié à l'utilisation d'une DTD. Si il n'y a pas de DTD ou si elle est interne, le document est autonome et la valeur de l'attribut standalone peut être définie à Initiation à XML - www.cti-formation.com www.asp-php.net By F.Remise alias Derf © 4 / 6 yes. Si la DTD référencée est externe la valeur de cet attribut doit être définie à no. Si l'attribut standalone est omis, c'est la valeur no qui est prise par défaut. Les attributs encoding et standalone sont facultatifs. L'élément racine L'élément racine est lui aussi obligatoire. Cet élément est une balise créée par vos soins. Elle est unique dans le document. Elle peut être comparée à la balise <body></body> d'un document HTML. Elle encadrera le contenu de votre document XML. L'élément racine est obligatoire tout comme le prologue. Ce sont les seuls éléments obligatoires. N'oubliez pas que XML est sensible à la casse, par conséquent <tag> et <Tag> n'ont pas la même signification. Pour notre exemple, nous nommerons l'élément racine librairie : <?xml version="1.0" encoding="iso-8859-1"?> <librairie> ... </librairie> Le contenu Pour le contenu, vous pouvez choisir, là aussi, vos propres noms de balises. Exemple 1 Dans mon exemple, ces éléments seront contenus par le nœud racine <librairie></librairie>. Chaque livre de ma librairie sera représenté par un élément <livre></livre>; Cet élément encadrera les sous éléments décrivant le livre : <titre></titre> - <auteur></auteur> - <editeur></editeur>. Listing du document XML : ex-1.xml <?xml version="1.0" encoding="iso-8859-1"?> <librairie> <livre> <titre>CSS 2</titre> <auteur>Daniel GLAZMAN</auteur> <editeur>Eyrolles</editeur> </livre> <livre> <titre>Formation à... XML</titre> <auteur>Michael J. YOUNG</auteur> <editeur>Microsoft Press</editeur> </livre> <livre> <titre>Visual Basic .Net</titre> <auteur>Richard CLARK</auteur> <editeur>Microsoft Press</editeur> </livre> <livre> <titre>ASP.Net – To the .Point</titre> <auteur>Grégory RENARD</auteur> <editeur>ASP-PHP.net</editeur> </livre> </librairie> Ouvrez un éditeur de texte et composez ces quelques lignes. Enregistrez le fichier avec l'extension .xml et ouvrez le dans MSIE. Vous remarquez que le fichier apparaît sous forme Initiation à XML - www.cti-formation.com www.asp-php.net By F.Remise alias Derf © 5 / 6 d'arborescence. Si vous faites la même expérience avec Netscape ou Opera, seul le texte pur, c'est à dire le texte encadré par les balises, s'affiche. Pour visualisé un document XML, il vaut faut un "parser" XML (parseur en français). Un parseur est un analyseur syntaxique. MSIE possède un parseur XML. Vous constatez également, et cela quelque soit le navigateur, que les caractères accentués apparaissent correctement. Ceci est dû à la déclaration concernant le jeu de caractère contenu par le prologue : iso-8859-1 soit Europe occidentale Latin 1. Il existe d'autres jeux de caractères. Jeux de caractères du Standard Unicode liste non exhaustive Norme Correspondance UTF-8 Jeu de caractères universel sur 8 bits UTF-16 Jeu de caractères universel sur 16 bits Jeux de caractères du Standard ISO liste non exhaustive Norme Correspondance ISO-8859-1 Latin 1 – Langues d'Europe de l'ouest et d'Amérique latine ISO-8859-2 Latin 2 – Langues d'Europe centrale et Slaves ISO-8859-3 Latin 3 – Langues Espéranto, Galicienne, Maltaise et Turc ISO-8859-4 Latin 4 – Langues Estonienne, Lettonne et Lithuanienne ISO-8859-5 Langue Cyrilliques ISO-8859-6 Langue Arabe ISO-8859-7 Langue Grecque ISO-8859-8 Langue Hébraïque ISO-8859-9 Latin 5 – Langue Turc ISO-8859-10 Latin 6 – Langues Groenlandaises et Lapones Certains caractères ayant une signification particulière dans la grammaire du XML restent interdits : < , > , & Pour ces caractères comme pour les caractères pouvant poser des problèmes à l'affichage utilisez les caractères de masquages (d'échappement) soit uploads/Litterature/ cours-apprendre-xml.pdf
Documents similaires
-
19
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Nov 28, 2022
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 0.8841MB