Chap. 5 Noyau XML 1.Origines et Objectifs 2. SGML et HTML 3. Introduction à XML
Chap. 5 Noyau XML 1.Origines et Objectifs 2. SGML et HTML 3. Introduction à XML 4. XML pour quoi faire ? 5) Structuration XML de base 6) Domaines nominaux 7) Schémas XML 1 1. Origine et objectifs • XML est issu de la Gestion de Documents (GED) • Séparation du fond de la forme. – Forme = présentation à partir de la structure (style) – Fond = structure + données (contenu) • Multiples précurseurs dont les plus connues : – SGML(Standard Generalized Markup Language) (pour la structuration – HTML (Hypertext Markup Language) pour la présentation – Approches mélangeant parfois le fond et la forme ! Origines 2 Présentation et Structuration XML: Des BD aux Services Web Georges Gardarin 1. Introduction Ces dernières années ont vu l'ouverture des systèmes d'information à l'Internet. Alors que depuis les années 1970, ces systèmes se développaient, le choc Internet … Ainsi, on a vu apparaître une myriade de technologies nouvelles attrayantes mais peu structurantes voir perturbantes. Certaines n'ont guère survécues … L'urbanisation passe avant tout par la standardisation des échanges : il faut s'appuyer sur des standards ouverts, solides, lisibles, sécurisés, capable d'assurer l'interopérabilité avec l'Internet et les systèmes d'information … 2. La société ProXML Titre Auteur Section Paragraphe Paragraphe Paragraphe Section Origines 3 Vue Balisée <Livre> <Titre> XML : Des BD aux Services Web</Titre> <Auteur>Georges Gardarin</Auteur> <Section titre = "Introduction"> <Paragraphe>Ces dernières années ont vu l'ouverture des systèmes d'information à l'Internet. Alors que depuis les années 1970, ces systèmes se développaient, le choc Internet … </Paragraphe> <Paragraphe>Ainsi, on a vu apparaître une myriade de technologies nouvelles attrayantes mais peu structurantes voir perturbantes. Certaines n'ont guère survécues … </Paragraphe> <Paragraphe>L'urbanisation passe avant tout par la standardisation des échanges : il faut s'appuyer sur des standards ouverts, solides, lisibles, sécurisés, capable d'assurer l'interopérabilité avec l'Internet et les systèmes d'information … </Paragraphe> </Section> <Section titre= "La Société ProXML"> … </Section> </Livre> Origines 4 XML : objectifs • XML= un nouveau langage d'échange basé sur le balisage • XML= plus simple que SGML • XML= plus ouvert que HTML englobé (XHTML) • XML = développé par XML Working Group dirigé par le W3C (depuis 1996) • XML 1.0 = recommandation officielle du W3C depuis le 10 février 1998 Origines 5 les 10 objectifs de conception: • XML doit pouvoir être utilisé sans difficulté sur Internet • XML doit soutenir une grande variété d'applications • XML doit être compatible avec SGML et HTML • Il doit être facile d'écrire des programmes traitant les documents XML • Le nombre d'options dans XML doit être réduit au minimum, idéalement à aucune Origines 6 les 10 objectifs de conception • Les documents XML doivent être lisibles par l'homme et raisonnablement clairs • La spécification de XML doit être disponible rapidement • La conception de XML doit être formelle et concise • Il doit être facile de créer des documents XML • La concision dans le balisage de XML est peu importante Origines 7 Origines Forces de XML • Séparation de la structure et de la présentation • Moins confus que HTML • Plus simple que SGML • Idéal pour l'échange de données semi-structurées • Utilisable entre machines 8 2. SGML et HTML • 1969 C. Goldfarb, E. Mosher, R. Lorie inventent GML chez IBM • GML a été créé pour éditer des documents, les mettre en page et les partager au sein de systèmes de gestion éditoriaux • 1978 Goldfarb prend la tête d’un comité « Computer Language for the Processing of Text » au sein de l’American National Standards Institute (ANSI). SGML 9 Qu'est-ce que SGML ? • Une norme internationale : – Standard Generalized Markup Language – ISO 8879 - 1989 • Un métalangage de balisage de documents – lisible par l’être humain et traitable par une machine – permet de définir des langages de balisage • Les documents sont balisés conformément à la grammaire (la DTD) – instances de DTD – permet un balisage sémantique du fond. • Implique la notion de validité d'un document SGML 10 SGML : objectifs • Séparation du fond et de la forme – possibilité de multiples présentations – un seul document en SGML – plusieurs formats : Postcript, HTML, etc. • Support de traitements sur le contenu des documents sans prise en compte de la forme • Proposition d’un cadre défini pour l’expression des modèles documentaires (validité, contrôle) • Intégration d'un format de stockage et d’échange normalisé SGML 11 SGML : critiques • Très lourd et complexe pour la mise en œuvre de documents respectant ce format • Une grande rigueur est demandée à l'entrée des documents • Standard complexe et complet pour le traitement des documents • Liens hypertextes possibles mais complexes SGML 12 HTML : présentation • Proposé par le W3C comme format de documents sur le Web. • Langage simple avec des balises standardisées permettant la mise en forme d’un texte. • Standard reconnu par tous les navigateurs. • Langage très populaire sur le Web <HTML> <HEAD> <TITLE> Exemple </TITLE> </HEAD> <BODY> <H1>Contenu du document</H1> <A HREF = "http://www.server.fr/Info /dir/test.html"> une référence externe </A> </BODY> </HTML> HTML 13 HTML : inconvénients • Normalisation des différentes balises difficile : – les constructeurs ont eu tendance à définir leurs propres balises pour répondre à leurs besoins (incompatibilité) – HTML 4.0 • boutons, tables, applets, objects, graphiques, maths, ... • styles, frames, protections, ... • Mises à jour difficiles : – données utiles et mises en forme ; – restructuration ou remise en forme de l’ensemble des pages du site fastidieux. • Mélange le fond et la forme – méta-données avec la présentation – Pages conçues pour 1 type de terminal HTML 14 Feuilles de style • Introduite pour diversifier les présentations • CSS (Cascading Style Sheet) – mécanisme d'héritage entre nœuds – une balise hérite de la parente – seulement ce qu'elle spécifie est redéfini • Recommandation W3C en décembre 1996 • Mécanisme simple pour ajouter un style aux documents Web – fonte, taille, couleur, etc. • Utilisables avec XML HTML 15 Exemple de CSS @import "truc.css" BODY { color: #000 ; background: #FBFBFF ; margin-left: 9% ; margin-right: 6% ; font-family: "Helvetica", sans-serif ; line-height: 1.35 ; } @import "truc.css" BODY { color: #000 ; background: #FBFBFF ; margin-left: 9% ; margin-right: 6% ; font-family: "Helvetica", sans-serif ; line-height: 1.35 ; } [ ... ] TD, TH { font-family: "Helvetica", sans-serif line-height: 1.35 ; } H1, H2 { margin-top: 1.2em ; margin-left: -7% ; color: #900 ; clear: both ; } [ ... ] [ ... ] TD, TH { font-family: "Helvetica", sans-serif line-height: 1.35 ; } H1, H2 { margin-top: 1.2em ; margin-left: -7% ; color: #900 ; clear: both ; } [ ... ] <LINK REL="stylesheet" HREF="fichier.css"> <LINK REL="stylesheet" HREF="fichier.css"> HTML 16 SGML et HTML : Résumé • SGML – langage de la GED plutôt complexe – très utilisé dans l'industrie • HTML – spécialisation de SGML – adapté à la présentation – inadapté à l'échange entre programmes HTML 17 3. XML: définitions de base • XML est un méta-langage universel pour représenter les données échangées sur le Web qui permet au développeur de délivrer du contenu depuis les applications à d'autres applications ou aux navigateurs • XML standardise la manière dont l'information est : – échangée – présentée – archivée – retrouvée – transformée – cryptée – ... XML 18 Les utilisateurs peuvent définir leurs propres tags Document bien formé: <Blé> <Type>Dur</Type> <Region> <Nom>Ouest</Nom> <Capitale>Oran</Capitale> </Region> <année>1995</année> <Prix Unite = "DA"> 50.5 </Prix> </Blé> Les tags indiquent la signification des sections marquées Il est possible d'imposer une grammaire spécifique (DTD, Schéma) XML : exemple simple XML 19 Concepts du modèle • Balise (ou tag ou label) – Marque de début et fin permettant de repérer un élément textuel – Forme: <balise> de début, </balise> de fin • Elément de données – Texte encadré par une balise de début et une de fin – Les éléments de données peuvent être imbriquées <producteur> <adresse> <rue>A. Benali</rue> <ville>Oran</ville> </adresse> </producteur> • Attribut – Doublet nom="valeur" qualifiant une balise • <producteur no="160017" region="Ouest"> XML 20 Les noeuds élément <?xml version="1.0" encoding="ISO-8859-1"?> <cours> <intervenant> Monser </intervenant> <separateur/> <chapitre> Formation XML <para>Un paragraphe</para> <para>Autre paragraphe</para> </chapitre> </cours> • cours : élément racine contenant trois éléments fils : intervenant, separateur et chapitre ; • intervenant : élément contenant du texte ; • separateur : élément sans contenu ; • chapitre : élément contenant du texte et des éléments fils para ; • para : élément contenant du texte. Si maintenant nous nous penchons sur la syntaxe, nous avons donc : • <element> : balise ouvrante. • </element> : balise fermante. • <element/> : balise ouverte et fermée que l’on nomme balise autofermée. C’est l’équivalent de <element></element>. Elle désigne donc un élément vide. 21 Les attributs d’un élément <auteur nom="bey" prenom="amine">…</auteur> <contact email='a@a.fr'/> nom et prenom sont des attributs de l’élément auteur alors que email est un attribut de l’élément contact. Choix entre éléments et attributs On peut définir cependant quelques règles simples pour déterminer s’il uploads/Litterature/ chap5-master.pdf
Documents similaires
-
13
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Sep 05, 2022
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 1.5055MB