Manuel de TXM Version 0.7.9 Février 2018 Copyright © 2013-2018 – ENS de Lyon &
Manuel de TXM Version 0.7.9 Février 2018 Copyright © 2013-2018 – ENS de Lyon & Université de Franche-Comté - http://textometrie.ens-lyon.fr Copyright © 2011-2012 – ENS de Lyon - http://textometrie.ens-lyon.fr Copyright © 2008-2010 – projet ANR Textométrie Dans l'esprit du logiciel open-source, ce manuel vous est fourni gracieusement en échange de retours de corrections et de propositions d'amélioration au bénéfice de la communauté des utilisateurs de TXM. Nous avons besoin de vous pour améliorer ce manuel. Voir la FAQ de TXM pour savoir comment contribuer : https://groupes.renater.fr/wiki/txm- users/public/faq. Ce document est publié sous licence Creative Commons BY-NC-SA : http://creativecommons.org/licenses/by-nc-sa/3.0/fr Table des mises à jour (lignes plus anciennes à la fin du document) 08/12/2017 SH Réglage des sections d’import et d’annotation 05/02/2018 SH Màj sections annotation URS 23/02/2018 SH Màj sections CAH, AFC, Extensions, Annotation URS, bibliographie 16/05/2018 SH Màj numérotation et titres de sections N° d'édition : 1161 Contenu : 253 pp., 58655 occ., 144 ill., 41 tab. Date d'édition : 16/05/18, 16:59:30 Manuel de TXM 0.7.8 – Août 2017 Sommaire 1 Préface.....................................................................................................................................5 1.1 Pourquoi lire ce manuel ?.................................................................................................5 1.2 Comment est organisé ce manuel ?..................................................................................6 1.3 Conventions typographiques............................................................................................6 2 Installer TXM..........................................................................................................................6 2.1 Installer TXM sur sa machine..........................................................................................7 2.2 Installer TreeTagger pour ajouter automatiquement des propriétés morphosyntaxiques et des lemmes aux mots........................................................................................................18 2.3 Mises à jour automatiques..............................................................................................20 2.4 Installer une extension...................................................................................................25 2.5 Désinstaller une mise à jour, une extension ou une extension tierce.............................28 2.6 Réglages de l'accès au réseau par proxy........................................................................29 2.7 Visualisation de l'espace mémoire utilisé.......................................................................29 2.8 En cas de problème avec le logiciel...............................................................................29 3 Lancer TXM..........................................................................................................................31 3.1 Sous Windows................................................................................................................31 3.2 Sous Mac OS X..............................................................................................................33 3.3 Sous Linux.....................................................................................................................33 4 Utiliser l’interface graphique de TXM : fenêtres, menus, barres d'outils et raccourcis clavier ...................................................................................................................................................34 4.1 Vue générale de l'interface graphique............................................................................34 4.2 Le gestionnaire de fenêtres............................................................................................51 5 Créer et manipuler de nouveaux corpus................................................................................52 5.1 Principes généraux d’import : les trois types de sources textuelles exploitables...........52 5.2 Philologie progressive : les trois principaux niveaux de représentation textuelle importables............................................................................................................................54 5.3 Carte des modules d’import et des niveaux de représentation.......................................56 5.4 Enchaînement canonique des opérations d’un module d’import...................................57 5.5 Création d’un corpus par appel d’un module d’import..................................................58 5.6 Exporter ou charger un corpus binaire...........................................................................63 5.7 Exporter les sources d'un corpus au format standard XML-TEI P5..............................64 6 Formats importables dans TXM............................................................................................64 6.1 Textes écrits....................................................................................................................65 6.2 Transcriptions d’enregistrements...................................................................................90 6.3 Corpus parallèles............................................................................................................92 7 Corpus exemples livrés avec TXM.......................................................................................92 7.1 Le corpus VOEUX.........................................................................................................92 7.2 Le corpus GRAAL.........................................................................................................93 - 2 - Manuel de TXM 0.7.8 – Août 2017 8 Analyser un corpus................................................................................................................94 8.1 Propriétés d’un corpus...................................................................................................94 8.2 Lecture d’un texte..........................................................................................................95 8.3 Lexique et Index.............................................................................................................97 8.4 Concordances...............................................................................................................103 8.5 Cooccurrences..............................................................................................................109 8.6 Progression...................................................................................................................111 8.7 Références....................................................................................................................113 8.8 Sous-corpus..................................................................................................................114 8.9 Partition........................................................................................................................117 8.10 Table lexicale.............................................................................................................122 8.11 Spécificités.................................................................................................................125 8.12 Analyse Factorielle des Correspondances (AFC)......................................................134 8.13 Classification Ascendante Hiérarchique (CAH)........................................................138 8.14 Visualisation graphique des résultats.........................................................................140 8.15 Exploitation des résultats...........................................................................................141 8.16 Récapitulatif des relations entre commandes et résultats...........................................146 9 Annoter un corpus...............................................................................................................148 9.1 Annotation simple par concordances...........................................................................148 9.2 Annotation avancée par concordances.........................................................................151 9.3 Limites de l’annotation simple et avancée...................................................................152 9.4 Annotation avec un modèle Unité-Relation-Schéma (URS) au fil du texte................153 10 Éditer un fichier texte........................................................................................................167 11 Préférences........................................................................................................................170 11.1 Section TXM..............................................................................................................170 11.2 Section TXM / Avancé...............................................................................................171 11.3 Section TXM / Utilisateur..........................................................................................173 12 Syntaxe des requêtes CQL................................................................................................179 12.1 Introduction................................................................................................................179 12.2 Recherche simple [niveau 1 (infralexical) : les valeurs]............................................181 12.3 Recherche sur les propriétés [niveau 2 (lexical) : les propriétés]..............................183 12.4 Recherche d'un motif de plusieurs mots [niveau 3 (supralexical) : séquences d'unités lexicales].............................................................................................................................185 12.5 Informations contextuelles.........................................................................................187 12.6 Lien d'alignement entre corpus parallèles..................................................................187 12.7 Stratégies de résolution des opérateurs itérateurs......................................................188 12.8 Documentation complémentaire................................................................................188 13 Syntaxe des expressions régulières...................................................................................190 14 Piloter la plateforme par macros ou par scripts Groovy ou R...........................................194 14.1 Utiliser des macros.....................................................................................................194 14.2 Utiliser des scripts Groovy.........................................................................................201 - 3 - Manuel de TXM 0.7.8 – Août 2017 14.3 Utiliser des scripts R..................................................................................................204 15 Raccourcis clavier.............................................................................................................214 15.1 Tableaux de résultats..................................................................................................214 15.2 Graphiques.................................................................................................................214 15.1 Éditeur de texte..........................................................................................................214 15.2 Fenêtres......................................................................................................................217 15.3 Raccourcis généraux..................................................................................................217 16 Extensions.........................................................................................................................217 16.1 Extension Analec........................................................................................................217 16.2 Extension XML Editor...............................................................................................217 17 Jeu d'étiquettes morphosyntaxiques du français...............................................................223 18 Documentation complémentaire.......................................................................................224 18.1 Le wiki des utilisateurs de TXM................................................................................224 18.2 La liste de diffusion des utilisateurs de TXM............................................................224 18.3 Le site web du projet Textométrie..............................................................................225 18.4 Le site web des développeurs du logiciel TXM.........................................................225 18.5 Les plaquettes de présentation de TXM.....................................................................226 18.6 TXM dans les réseaux sociaux...................................................................................226 18.7 Les Ateliers de formation TXM.................................................................................226 18.8 Accéder à la documentation en ligne.........................................................................227 19 Glossaire............................................................................................................................228 20 Bibliographie.....................................................................................................................235 21 Index des illustrations et des tableaux...............................................................................237 22 Table des matières.............................................................................................................243 - 4 - Manuel de TXM 0.7.8 – Août 2017 1 Préface 1.1 Pourquoi lire ce manuel ? Si vous souhaitez utiliser la plateforme TXM (Heiden, 2010b, 2010a), ce manuel vous expliquera, pas à pas, les différents concepts du logiciel ainsi que ses divers outils d’analyse de corpus textuels. Le logiciel TXM vous aide à construire et à analyser des corpus annotés et structurés : • Le logiciel vous permet d'importer des ressources textuelles afin de construire un corpus provenant de diverses sources, ou directement, depuis n'importe quel texte copié dans le presse-papier. • Il construit des sous-corpus à partir de différentes propriétés des unités textuelles • Il construit des partitions à partir de ces propriétés • Il construit une édition HTML pour chaque unité textuelle du corpus • Il calcule le vocabulaire d'ensemble d'un corpus ou la liste des valeurs d'une propriété particulière • Il construit des tables lexicales à partir de partitions ou d'index. • Il recherche des motifs lexicaux complexes construits à partir des propriétés des unités lexicales et produit des concordances kwic à partir des résultats. Depuis chaque ligne de concordance, vous pouvez accéder à la page correspondante dans l'édition HTML • Il calcule des cooccurrents situés autour d'un motif lexical complexe. • Il calcule les références de motifs lexicaux complexes • Il calcule le modèle des spécificités de mots ou d'étiquettes situés à l'intérieur d'une partition ou d'un sous-corpus • Il calcule l'analyse factorielle des correspondances de propriétés des mots sur une partition. • Il calcule la classification d'une partition Le logiciel est composé de quatre modules en synergie : • le moteur de recherche plein texte CQP ; • le moteur statistique R ; - 5 - Manuel de TXM 0.7.8 – Août 2017 • le module d'importation de textes pour construire les corpus ; • l'interpréteur de scripts. Ce manuel vous présentera chacun de ces modules au travers des diverses commandes disponibles. 1.2 Comment est organisé ce manuel ? Le manuel décrit dans un premier temps comment installer le logiciel selon les différents systèmes d'exploitation et comment lancer TXM. Il expose ensuite les éléments de l'interface utilisateur et la manière d'importer de nouveaux corpus dans la plateforme. La section qui vient par la suite présente les divers outils et la façon de les utiliser pour analyser un corpus. Enfin, il vous sera introduit le moyen de piloter la plateforme grâce aux scripts. Le document se clôt sur un glossaire et un index de référence. 1.3 Conventions typographiques Dans ce manuel, certains éléments sont mis en valeur par une typographie différente : • les expressions littérales sont en police Courier : les chemins d'accès aux dossiers, les noms de fichiers, les exemples de requêtes et de chaîne de caractères ainsi que les liens hypertextes. • la police Arial est réservée aux titres de sections • la police Arial est réservée aux commandes de l'application 2 Installer TXM - 6 - Manuel de TXM 0.7.8 – Août 2017 2.1 Installer TXM sur sa machine 2.1.1 Prérequis d'installation Vous aurez besoin des droits d'installation sur votre machine pour pouvoir installer TXM. Vous aurez besoin d'un accès à Internet. Cette version du logiciel est compatible avec les systèmes d'exploitation suivants : • Windows 7 : voir les instructions d'installation à la section 2.1.2 ci-dessous ; • Mac OS X 10.12 (Sierra) : voir les instructions d'installation à la section 2.1.3 page 10 ; • Linux Ubuntu 16.04 et supérieur et ses variantes (Xubuntu, Kubuntu, Lubuntu) : voir les instructions d'installation à la section 2.1.4 page 12 . Autres versions de systèmes pour lesquels TXM fonctionne également. Espace disque nécessaire pour l'installation de TXM : Windows : 250 Mo Mac OS X : 335 Mo Linux : 200 Mo Ajouter 120 Mo pour les corpus exemples DISCOURS et GRAAL quel que soit le système Ressources nécessaires pour l'usage de TXM : disque : prévoir de l'espace pour chaque corpus supplémentaire, exemples : DISCOURS : 50 Mo (100 000 mots, 4 propriétés de mots) Base de français médiéval (BFM) : 1.4 Go pour 5 M mots, 14 propriétés de mots et 60 propriétés de structures etc. mémoire : 1 Go (voir la section 2.7 page 29 pour visualiser l'utilisation mémoire courante) - 7 - Manuel de TXM 0.7.8 – Août 2017 2.1.2 Installation sur Windows 2.1.2.1 Avertissement avant installation (Windows 7 et 8) L'installeur de TXM n'est pas certifié par un organisme reconnu de Microsoft ce qui provoque l'affichage d'une fenêtre d'avertissement en plein écran. Pour continuer l'installation, il suffit de sélectionner « OK » puis « Exécuter quand uploads/Management/ manuel-de-txm-0-7-fr.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/6yUhnYsAuv7gQZmo69zVYBW3kO6iLEIk93VNvGd3ErNb8c9nGDjOuwrgWik460vKrf852WN1jt31qJUuFPweI52K.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/mBk38rLwVrG8du662SJzxOA91UAfUdH3kYDCEE3RcKPSD6CDMvlR72KBkw9zv555iOS1fdSrIB6hfD5VWFhG9z78.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/503sISX5Ce5VWepXFR2NX7w1oFKRyFjA3uc61XSkypHUZBLBqZQhUQUbiWjo026qFpJpiUVA7JALCxBZqAdEN0kn.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/ne9WEgCDmc6m2OhwLErSCfaekRl9venkt9ofwOZ1OM1Lzc007YBR33HdIJlBoBBoDNDOvohgXJY7Q4XFk7T7dzlu.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/jklU2cpFgcimDtPeITHU6vhj85NBZ5AIcqntO5naCgKXgeOXrJQS8f4iO1A2tvIrcAaGyruCcin7C9CyoSxiGt9g.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/x5V0lIgkhxhPe5li4fM2HUfJECO5SLHDahmxzo4sVhACikQMEPAh6A6t4rqDJgSleNHCKTOdwmhkdvUt6XgxU0Zd.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/osNJnYVXv89s3pmX2r0Vu9niQE92D7eljiuY0tBdhxAVDTuVZU2NUghDu6Mjxo3rrEkLyXDcZxTjHEchc1fcQFo6.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/7gF8sFjTa06VqQEYx15cQtLtFPNx8Vk414L9YaAOgq2HF3M255n4Zd8kWReomB9hj3BYdsFRjpgZcmd8q2522R6G.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/EWFXIeW8zpsUo6GqJpwAmou6qWv6gXa5bXBggYgqYzedDbN2LPz5sKDNp8b777PIGQyKHfrVTpni7Sn2l5mL1T41.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/msDCPfeLGrGU3EP77nNAXszEyHtqhzQxYh3xGLqXdRsJ0fbTBC9bmkpxE6h6BlxHEPKZ8dTYUp5TMbOf7m8np0Mr.png)
-
25
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Mai 02, 2021
- Catégorie Management
- Langue French
- Taille du fichier 5.0351MB