Jacques Le Maitre Description, parcours et transformation d’un document XML 1 D
Jacques Le Maitre Description, parcours et transformation d’un document XML 1 Description, parcours et transformation d’un document XML Jacques Le Maitre Université de Toulon et du Var Jacques Le Maitre Description, parcours et transformation d’un document XML 2 Différents aspects d’un document Editorial présentation du document. Signalétique identification du document : ISBN, titre, auteurs, éditeur, année, ... Structurel organisation logique du document : découpage en chapitres et en paragraphes, figures, annotations, ... Sémantique sujet traité par le document. Multimédia type des données véhiculées : textes, images, sons, animation, ... Jacques Le Maitre Description, parcours et transformation d’un document XML 3 De SGML à XML en passant par HTML et HyTime SGML Inventé par Charles Goldfarb, juriste chez IBM. Du balisage typographique au balisage logique. HTML Inventé par Tim Berners-Lee comme langage de description des pages du Web. Concept d’ancre : hypertexte. HyTime Langage très ambitieux pour la description des liens intra et inter documents. XML Une synthèse de SGML, HTML et HyTime. Jacques Le Maitre Description, parcours et transformation d’un document XML 4 Le monde XML (ou plutôt un extrait !) DTD XML Schema Métadescription XML Hiérarchique XLink XPointer XPath Hypertextuelle Description XSLT XSL Transformation Présentation SAX DOM Programmation (API) XQuery Interrogation XML Jacques Le Maitre Description, parcours et transformation d’un document XML 5 Plan Description : le langage XML, Parcours : le langage XPath, Structure hypertextuelle : le langage XLink, Transformation : le langage XSLT. Jacques Le Maitre Description, parcours et transformation d’un document XML 6 Description : le langage XML Jacques Le Maitre Description, parcours et transformation d’un document XML 7 Structure logique d’un document XML Un document XML est découpé en éléments structurés hiérarchiquement. Un document a un élément racine appelé élément du document. Un élément est composé : d’un nom qui spécifie son type, d’attributs, d’un contenu formé d’éléments ou de textes. Un texte est une chaîne de caractères. Un attribut a un nom et une valeur qui est une chaîne de caractères. Syntaxiquement, les éléments d’un document XML sont marqués dans le document lui-même par des paires de balises ouvrantes et fermantes. Jacques Le Maitre Description, parcours et transformation d’un document XML 8 Exemple Par exemple, un livre peut être représenté en XML par : un élément livre composé : d’un attribut isbn dont la valeur est l’ISBN de ce livre, d’un élément titre, de plusieurs éléments chapitre, un élément chapitre est composé par : un élément titre, plusieurs éléments paragraphe, un élément titre est composé du texte de ce titre, un élément paragraphe est composé du texte de ce paragraphe. Jacques Le Maitre Description, parcours et transformation d’un document XML 9 DTD Les éléments qui décrivent un document peuvent être définis dans une DTD (Définition de Type de Document), mais ce n’est pas obligatoire. Un document XML est dit valide s’il est précédé de sa DTD et si sa description est conforme à cette DTD. Un document XML est dit bien formé s’il n’est pas précédé d’une DTD mais si sa description est syntaxiquement correcte. Jacques Le Maitre Description, parcours et transformation d’un document XML 10 Un exemple de document Itinéraires skieurs dans la Vallée de la Clarée par Jean-Gabriel Ravary Le Polygraphe, éditeur 1991 Vallon des Muandes Vallon situé à l’est du refuge des Drayères. Le vallon le plus utilisé pour la traversée sur la Vallée Etroite. Ce vallon est également accessible du refuge Laval. Col de Névache (2 794 m) ** n° 1 S’élever au-dessus du refuge des Drayères en direction est. Suivre la rive droite du torrent de Brune puis s’engager sur le flanc droit du ravin des Muandes que l’on quitte vers 2500 m pour rejoindre le col situé au nord. Descente possible sur Valmeinier. Départ assez raide. Pointe de Névache (2 892 m) *** n° 2 Du col de Névache (itinéraire n° 1), suivre la ligne de crête qui mène à la pointe de Névache. Attention : corniches possibles. Crampons utiles au printemps. Jacques Le Maitre Description, parcours et transformation d’un document XML 11 Le guide « Itinéraires skieurs » en XML (1) <?xml version="1.0"?> <guide> <titre>Itinéraires skieurs dans la vallée de la Clarée</titre> <auteur>Jean-Gabriel Ravary</auteur> <editeur>Le Polygraphe</editeur> <annee>1991</annee> … <vallon id="V15"> <nom>Vallon des Muandes</nom> <intro> <para>Vallon situé à l’est du refuge des Drayères.</para> <para>Le vallon le plus utilisé pour la traversée sur la Vallée Etroite. Ce vallon est également accessible du refuge Laval.</para> </intro> ... Itinéraires ... </vallon> </guide> Jacques Le Maitre Description, parcours et transformation d’un document XML 12 Le guide « Itinéraires skieurs » en XML (2) <itineraire id="I15.1"> <nom>Col de Névache</nom><alt>2794</alt><cotation>**</cotation> <num>1</num> <para>S’élever au-dessus du refuge des Drayères en direction est. Suivre la rive droite du torrent de Brune puis s’engager sur le flanc droit du ravin des Muandes que l’on quitte vers 2500 m pour rejoindre le col situé au nord. Descente possible sur Valmeinier. <note type="prudence">Départ assez raide.</note></para> </itineraire> <itineraire id="I15.2"> <nom>Pointe de Névache</nom><alt>2892</alt><cotation>***</cotation> <num>2</num> <para>Du col de Névache <renvoi cible="I15.1"/>, suivre la ligne de crête qui mène à la pointe de Névache. <note type="prudence">Attention : corniches possibles.</note> <note type="materiel">Crampons utiles au printemps.</note></para> </itineraire> Jacques Le Maitre Description, parcours et transformation d’un document XML 13 Production d’un document XML Pour produire un document XML, un utilisateur dispose des outils logiciels suivants : éditeurs de texte classiques ; éditeurs syntaxiques (Emacs ou XML Notepad, par exemple) qui permettent de produire des documents XML bien formés ; analyseurs ou « parseurs », qui contrôlent la validité d’une DTD ou d’un document et le traduise sous une forme interne adaptée par son traitement par une application ; éditeurs validants, qui combinent les fonctionalités des éditeurs syntaxiques et des analyseurs. Jacques Le Maitre Description, parcours et transformation d’un document XML 14 Structure d’un document XML Un document XML est composé : d’un prologue facultatif (voir ci-après « Organisation d’un document XML »), de l’élément du document qui est lui-même composé d’éléments et de textes. Dans le prologue et dans le contenu d’un élément, on peut insérer : des commentaires, des instructions de traitement (que nous n’étudierons pas dans ce cours) qui sont destinés aux applications traitant le document. Un document peut être découpé en entités enregistrées dans un ou plusieurs fichiers. Jacques Le Maitre Description, parcours et transformation d’un document XML 15 Noms et tokens de nom Un caractère de nom est soit une lettre, soit un chiffre, soit un point, soit un tiret, soit un espace souligné, soit un deux-points. Un nom est une suite de un ou plusieurs caractères dont : le premier est soit une lettre, soit un espace souligné, soit un deux-points (réservé à la séparation d’un nom et de son préfixe, voir ci-aprés « Espaces de noms »), chacun des suivants est un caractère de nom. Par exemple : xml:lan extrait_de titre poeme-79 Un token de nom est une suite de un ou plus caractères de nom. Jacques Le Maitre Description, parcours et transformation d’un document XML 16 Elément Un élément est composé : d’une balise de début qui contient le nom de l’élément et éventuellement ses attributs, d’un contenu, d’une balise de fin. Par exemple : <note type="prudence">Départ assez raide.</note> balise de début : <note type="prudence"> nom : note attribut : type="prudence" contenu : Départ assez raide. balise de fin : </note> Jacques Le Maitre Description, parcours et transformation d’un document XML 17 Contenu d’un élément vide : <renvoi cible="I15.1"></renvoi> ou <renvoi cible="I15.1"/> composé d’éléments : <intro> <para>Vallon situé à l’est du refuge …</para> <para>Le vallon le plus utilisé pour la traversée …</para> </intro> mixte : mélange de textes et d’éléments <nom>Col de Névache</nom> <para>Du col de Névache <renvoi cible="I15.1"/>, suivre la ligne de crête qui mène à la pointe de Névache.<note type = "prudence">Attention : corniches possibles. </note><note type="matériel">Crampons utiles au printemps.</note> </para> Jacques Le Maitre Description, parcours et transformation d’un document XML 18 Elément mixte Le contenu d’un élément mixte est constitué d’une chaîne de caractères dans laquelle peuvent être insérés des éléments. Cette insertion découpe ce contenu en deux types de constituants : les plus longues suites d’au moins un caractère dans lesquelles ne sont pas insérés d’éléments : nous les appellerons textes, les éléments. Par exemple, le contenu : Du col de Névache <renvoi cible="I15.1"/>, suivre la ligne de crête qui mène à la pointe de Névache. comprend dans l’ordre : le texte : Du col de Névache l’élément : <renvoi cible="I15.1"/> le texte : , suivre la ligne de crête qui mène à la pointe de Névache. Jacques Le Maitre Description, parcours et transformation d’un document XML 19 Section CDATA Lorsqu’un texte uploads/s1/ informatique-cours-de-xml-124-slides-jacques-le-maitre-universite-de-toulon.pdf
Documents similaires
-
23
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Mai 13, 2022
- Catégorie Administration
- Langue French
- Taille du fichier 0.4356MB