N° d’ordre 05 ISAL 0095 Année 2005 Thèse Nouveau modèle de documents pour une b

N° d’ordre 05 ISAL 0095 Année 2005 Thèse Nouveau modèle de documents pour une bibliothèque numérique de thèses accessibles par leur contenu sémantique Présentée devant L’institut national des sciences appliquées de Lyon Pour obtenir Le grade de docteur Formation Doctorale Documents multimédia, Images et Systèmes d’Information Communicants (DISIC) École Doctorale École Doctorale Informatique et Information pour la Société (EDIIS) Par María del Rocío ABASCAL MENA Soutenue le 30 novembre 2005 devant la Commission d’examen Jury MM. B. Rumpler Maître de conférences (INSA de Lyon), Directeur C. Soulé-Dupuy Professeur (UPS IRIT – Toulouse) Rapporteur D. Sol Professeur (UDLA – Mexique) Examinateur I. Roxin Professeur (UFR STGI – Montbéliard) Rapporteur J-M. Pinon Professeur (INSA de Lyon), Directeur M. Schneider Professeur (LIMOS – Clermont Ferrand) Examinateur M. Joly Directrice Doc’INSA (INSA de Lyon) Membre invité Cette thèse a été préparée au Laboratoire d’InfoRmatique en Image et Systèmes d’information (LIRIS) Remerciements Remerciements C’est avec un réel plaisir et un grand enthousiasme que je me livre à la rédaction de cette page. Bien plus que le point final du manuscrit scientifique, cette page constitue l’opportunité de m’accorder une réflexion sur une période de ma vie très riche en émotions. Les travaux présentés dans ce mémoire ont été menés au sein du Laboratoire d’InfoRmatique en Images et Systèmes d’information (LIRIS) de l’INSA de Lyon. Cette thèse a été réalisée avec le financement d’une bourse de la part du CONACyT (Consejo Nacional de Ciencia y Tecnología, Mexique). Je tiens à remercier le CONACyT pour le support économique qui m’a permis de réaliser et de finir ce travail dans les meilleures conditions. Pour la confiance qu’il m’a accordée en m’accueillant au sein de son laboratoire, me permettant de réaliser ce travail de thèse, je tiens à remercier le Professeur Robert Laurini, directeur adjoint du LIRIS. Je lui suis reconnaissante de l’intérêt qu’il a témoigné à mon séjour en France tant sur le plan pédagogique qu’humaine. J’adresse mes remerciements au Professeur Jean-Marie Pinon qui a soutenu l’encadrement de cette thèse et qui a permis de la valoriser. Un grand merci à Madame Béatrice Rumpler, ma directrice de thèse, pour la qualité de son encadrement. Ses compétences scientifiques, mais aussi ses qualités humaines ont été des éléments précieux pour l’avancement de mon travail. Je lui suis reconnaissante pour sa patience, ses encouragements, sa sympathie et sa disponibilité à tout moment. Je laisse une porte ouverte pour des nouveaux travaux ensemble et pour des coopérations futures. Je suis vivement reconnaissante au Professeur Michel Schneider d’avoir accepté la charge de président du jury. Je tiens à exprimer mes sincères remerciements aux Professeurs Chantal Soulé- Dupuy et Ioan Roxin, qui m’ont fait l’honneur d’évaluer ce travail et qui ont, par la qualité et la pertinence de leur remarques, permis d’améliorer la rédaction de cette thèse. Je les remercie sincèrement de m’avoir permis de profiter de leurs compétences et de leurs connaissances, et l’honneur qu’ils m’ont accordé en acceptant la charge de rapporter mon travail. Je remercie également Monsieur le Professeur David Sol pour son déplacement du Mexique afin d’être présent dans le jury. Je tiens à remercier Madame Remerciements Monique Joly, Directrice de Doc’INSA, pour avoir accepté être membre invité du jury. Un grand MERCI à Mlle. Dalila Boudia, chargée de la diffusion électronique des thèses à Doc’INSA, pour sa disponibilité et amabilité au cours de cette thèse. Je n’oublierai pas non plus de remercier toutes les personnes que j’ai pu côtoyer pendant ces cinq ans au laboratoire que ce soit au couloir, à la pause de midi ou encore lors de discussions fructueuses. Je citerai tout particulièrement à ceux qu’ont partagé avec moi le bureau de travail : Guillaume et Hassan, pour leur soutien moral et amical. Je tiens à exprimer mon meilleur souvenir : A Suela Berisha-Bohé pour sa gentillesse infaillible, sa grande serviabilité. Je la remercie pour la sympathie qu’elle m’a témoignée dès nos tous débuts communs … si maintenant nous allons être séparées, ainsi va la vie, et cela n’enlève la grande amitié que nous avons créée pour toujours. A tous ceux qui j’ai connu pendant mon stage en France et qui sont devenus proches et chers à mon cœur. Merci pour m’avoir permis de vivre cette expérience qui m’a fourni une énergie si forte qu’elle va rendre mon départ très difficile. J’espère de tout mon cœur qu’il y aura un autre lieu, un autre espace pour se retrouver. Je remercie ma sœur qui m’a soutenu et encouragé pendant tout mon stage en France malgré la distance qui nous sépare. Je t’aime beaucoup. Enfin, je dédie ce travail à mes parents et à mon compagnon dans la vie, Erick. Leur soutien et amour sans limites ont été essentiels. Cette thèse est aussi le fruit de leur effort. Résumé Nouveau modèle de documents pour une bibliothèque numérique de thèses accessibles par leur contenu sémantique Résumé La diversité des initiatives existantes en faveur de la diffusion des thèses sur Internet témoigne de l’intérêt pour ce besoin au sein des milieux universitaires. Les projets de bibliothèques numériques actuels offrent à l’utilisateur l’accès aux thèses à partir d’une recherche en utilisant le titre de la thèse, les noms de l’auteur, le nom du directeur de la thèse, et la date de soutenance. Ce type de recherche ne permet pas d’extraire les parties pertinentes de la thèse et ne renvoie que la thèse intégrale. Ainsi l’utilisateur doit lire des chapitres entiers pour connaître les parties qui correspondent à son besoin. Le projet CITHER de l’INSA de Lyon (Consultation en texte Intégral des THèses En Réseau) dans lequel s’inscrit cette étude, porte sur la mise en ligne des thèses. CITHER, dans une première phase, a mis en place une diffusion des thèses, via un serveur, sous forme de texte intégral, en format PDF (Portable Document Format). De ce fait, lors d’une recherche il est possible d’accéder au contenu d’une seule thèse à la fois, par le biais de chaque chapitre. Pourtant il existe le besoin d’effectuer une recherche d’information de manière plus précise, plus sélective et d’offrir à l’utilisateur l’information la plus pertinente. L’objet du travail de recherche vise à améliorer la diffusion des thèses. Pour cela, nous proposons de permettre l’accès à son contenu de façon précise grâce à l’utilisation de « tags sémantiques » rajoutés, par le doctorant, au sein de la thèse lors de sa rédaction. L’exploitation de ces tags permet d’affiner la recherche et ainsi mieux satisfaire l’utilisateur. Notre travail porte sur la définition d’un nouveau modèle de document en nous appuyant sur l’étude des différentes structures de la thèse (structure logique et structure sémantique). Notre approche est fondée sur la modélisation sémantique des thèses de l’INSA de Lyon. Nous avons aussi, été amenés à mettre en place des fonctionnalités d’aide à la recherche et à l’accès aux contenus documentaires, adaptées à notre cas d’étude, c’est à dire les thèses scientifiques. Enfin, nous avons mis en place des procédures d’évaluations expérimentales qualitatives et quantitatives, permettant une analyse de performance des résultats des recherches itératives de notre prototype et de les comparer avec le système actuel de CITHER. Cette recherche représente un apport intéressant pour la recherche d’information pertinente dans les thèses, en fournissant au doctorant les moyens de construire facilement sa thèse de manière adaptée. Résumé Nos résultats ont permis de valider l’importance de définir la structure sémantique lors de la création de documents afin de mieux exploiter l’information contenue. Mots-Clés: bibliothèque numérique – Traitement Automatique des Langues (TAL) – XML – ontologie – Recherche d’information (RI) - métadonnées – structure du document – modélisation sémantique – thèses scientifiques New model of documents for a digital library of theses accessible by their semantic contents Abstract The variety of existing initiatives in favor of the diffusion of the theses on Internet shows the interest of this need within the academic world. The current projects of digital libraries offer the user an access to the digital theses by searching within the title of the thesis, the name of the author, the name of the tutor, and the date of the defense of the thesis. On the other hand, this type of research does not make possible to extract the relevant parts of the thesis and it only returns the integral thesis. Thus, the user must have to read the whole chapters to know which parts of the thesis correspond to his needs. The project named CITHER of the INSA of Lyon (Consultation en texte Intégral des THèses En Réseau), in which is registered this study, relates to the setting of the theses online. CITHER, in a first phase, has set up a diffusion of the theses, via a server, in the form of complete text, in PDF (Portable Document Format). So, by making a research is possible to reach the contents of only one thesis at the same time, by the means of each chapter. This way, there is the need to carry out a research for information in a more precise and more selective way in order to offer to the user uploads/Science et Technologie/ maria-del-rocio-abascal-mena-nouveau-modele-de-documents-pour-une-bibliotheque-numerique-des-theses 1 .pdf

  • 27
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager