Guide de transcription d'entretien avec Transcriber pour TXM1 Serge Heiden Béné
Guide de transcription d'entretien avec Transcriber pour TXM1 Serge Heiden Bénédicte Pincemin Copyright © - ANR Textométrie http://textometrie.ens-lyon.fr Ce document est publié sous licence Creative Commons BY-NC-SA Table des révisions Date Nom Modification 30/11/10 Serge Heiden (SH) Création du document 03/12/10 SH Conventions en annexe, modifs mineures et ajout de 'LocuteursTranscriber.trs' pour les identifiants anonymes 06/12/10 SH Modifs intro+conv. ortho., ajout illustration, shortcuts 10/12/10 SH+Bénédicte Pincemin (BP) Déplacements, précision de certaines conventions, etc. 09/05/11 SH Développé section « Navigation entre la saisie de la transcription et l'écoute de l'enregistrement sonore » 10/05/11 SH+BP+Matthieu Decorde (MD) Créé la section « Stylage de l'édition d'une transcription » 22/11/11 BP Révision générale, notamment concernant la mise en route de transcriber, l'utilisation des balises d'événements. Réorganisation et simplification des sections 3 et 4 : retrait des notations ^^ et *, prise en compte intuitive des guillemets, suppression du long développement sur les préfixes agglutinés. 1 Ce guide a été construit en reprenant de très larges proportions du « Manuel du transcripteur » pour le logiciel Transcriber situé à l'adresse : http://trans.sourceforge.net/en/transguidFR.php, et en l'adaptant aux spécificités de la transcription d'entretiens pour TXM. 1 Généralisation des passages spécifiques à l'enquête réalisée en 2010. Ajout d'une section sur la prise en compte des annotations de transcription dans TXM. 25/11/11 SH Réglage des titres de section pour la TDM 2 Table des matières 1 Introduction.....................................................................................................................................5 2 Formats audio conseillés.................................................................................................................5 3 Maniement de Transcriber...............................................................................................................6 3.1 Structuration de la transcription.................................................................................................6 3.2 Paramétrage de Transcriber.......................................................................................................6 3.3 Comment transcrire un nouvel enregistrement ?.......................................................................7 3.4 Segmentation du signal..............................................................................................................7 3.4.1 Où segmenter ?...................................................................................................................7 3.4.2 Comment segmenter ?........................................................................................................7 3.5 Transcription orthographique.....................................................................................................7 3.5.1 Comment transcrire ?.........................................................................................................8 3.5.2 Navigation entre la saisie de la transcription et l'écoute de l'enregistrement sonore.........8 3.6 Commentaires et balises d'événements......................................................................................9 3.7 Tours et locuteurs.....................................................................................................................11 3.7.1 Comment créer les tours de parole?.................................................................................11 3.7.2 Parole simultanée.............................................................................................................11 3.8 Sections....................................................................................................................................12 3.8.1 Comment indiquer les sections ?......................................................................................12 3.8.2 A quoi servent les sections ?............................................................................................12 3.9 Comment vérifier la transcription ?.........................................................................................12 4 Conventions de transcription orthographique................................................................................13 4.1 Généralités...............................................................................................................................13 4.1.1 Rôle et portée de ces conventions....................................................................................13 4.1.2 Principes de base..............................................................................................................13 4.1.3 Principales conventions typographiques..........................................................................14 4.2 Spécificités du langage parlé...................................................................................................14 4.2.1 Silences............................................................................................................................14 4.2.2 Prosodie, intonation.........................................................................................................14 4.2.3 Onomatopées....................................................................................................................15 4.2.4 Répétitions.......................................................................................................................15 4.2.5 Elisions & formes réduites...............................................................................................15 4.2.6 Troncatures.......................................................................................................................16 4.2.7 Lapsus..............................................................................................................................16 4.2.8 Prononciation erronée......................................................................................................16 4.2.9 Liaisons............................................................................................................................17 4.3 Mots hors-lexique....................................................................................................................17 4.3.1 Mots d'origine étrangère, noms propres étrangers, changement de langue.....................17 4.3.2 Mots techniques, nouveaux mots, noms propres inconnus..............................................17 4.4 Conventions d'écriture diverses...............................................................................................18 4.4.1 Sigles................................................................................................................................18 4.4.2 Épellations........................................................................................................................19 4.4.3 Ponctuation verbalisée.....................................................................................................20 4.4.4 Abréviations.....................................................................................................................20 4.4.5 Nombres...........................................................................................................................20 4.4.6 Dates.................................................................................................................................21 4.4.7 Chiffres romains...............................................................................................................21 4.4.8 Adresses internet..............................................................................................................21 5 Raccourcis clavier..........................................................................................................................23 3 6 Utilisation des informations de transcription dans TXM..............................................................24 6.1 Stylage de l'édition d'une transcription....................................................................................24 6.2 Indexation, structuration et propriétés d'analyse......................................................................25 4 1 Introduction Ce guide a été préparé dans le cadre de la campagne d'entretiens du Master 1 «Systèmes Territoriaux, Développement durable et Aide à la décision », MODULE 29 bis : Méthodes et outils : la production scientifique (perfectionnement), GEO020, lors de sa première édition en 2010. Dans cette campagne, les étudiants enquêteurs commencent par réaliser des entretiens enregistrés et sauvegardés dans des fichiers audio sur le disque dur de leur ordinateur. Nous décrivons dans ce qui suit un ensemble de conventions pour transcrire ces enregistrements d'entretiens avec le logiciel libre2 et gratuit Transcriber version 1.5.1 pour Windows, Mac et Linux (http://trans.sourceforge.net/en/presentation.php. Le logiciel Transcriber a été choisi pour assister le travail d'édition de la transcription car il offre une interface particulièrement efficace pour naviguer au sein de l'enregistrement (en utilisant une forme graphique de l'onde sonore), au sein de la transcription avec un éditeur de texte spécialisé et pour naviguer entre les deux avec la souris par le biais de balises situées dans la transcription et de segments posés sur l'onde sonore. Les différentes étapes du travail de transcription sont : l'identification des tours de paroles et des locuteurs, la segmentation de la bande son, la transcription orthographique, et la vérification. Ces étapes peuvent être menées en parallèle ou au contraire appliquées séquentiellement sur de longues portions du signal, suivant le choix du transcripteur. Une fois terminée, la transcription sera sauvegardée au format TRS puis elle sera ajoutée avec son fichier audio au répertoire commun de la campagne. L'étudiant pourra alors importer l'ensemble des transcriptions sous la forme d'un corpus dans le logiciel TXM, afin d'effectuer son travail d'analyse sur l'ensemble des entretiens avec l'aide de la plateforme. Ce document va successivement présenter les formats audio gérés par Transcriber, la structure d'une transcription et les actions d'édition associées, les outils de vérification et terminera avec les conventions détaillées de transcription orthographique en annexe. L'étudiant n'est pas obligé de suivre à la lettre toutes les conventions indiquées en annexe, mais il doit faire le maximum pour utiliser des règles uniformes pour toutes ses transcriptions, et si possible, identiques à celles des autres étudiants. Le meilleur moyen étant que tous choisissent les règles communes proposées en annexe en cas de doute sur une transcription donnée. Il s'agit également de produire une transcription orthographique pour chaque locuteur qui soit compatible avec l'analyse linguistique automatique qui aura lieu lors de l'import des transcriptions dans TXM. L'analyse linguistique automatique, qui consiste à identifier les mots et à leur associer des propriétés comme leur catégorie grammaticale ou leur lemme, s'applique à du texte français en écriture standard. Toutes les remarques afin d'améliorer ce guide seront les bienvenues. 2 Formats audio conseillés Les formats audio à utiliser de préférence avec Transcriber sont le WAV (format PCM standard de du système d'exploitation Windows) et le OGG (format identique au MP3, mais sans licence commerciale associée). Les paramètres suivants pour le format WAV (non compressé) sont conseillés : 2 open-source 5 – échantillonnage : 44,1 Khz – mode : stéréo – résolution : 16bits Les paramètres suivants pour le format OGG sont conseillés : – échantillonnage : 44,1 Khz – mode : stéréo – résolution : 16bits – débit : 192 Kbits/sec Selon les ordinateurs, le format MP3 est plus ou moins bien géré par Transcriber. Pour manipuler les fichiers audio, nous vous conseillons le logiciel libre et gratuit Audacity disponible pour Windows, Mac et Linux : http://audacity.sourceforge.net. Ce logiciel peut notamment aider à éditer le signal audio en cas de difficultés d'écoute de certains segments, comme ralentir automatiquement la vitesse de lecture d'une portion d'enregistrement ou encore marquer automatiquement des plages de silence dans un enregistrement. 3 Maniement de Transcriber 3.1 Structuration de la transcription Un document de transcription est structuré de la manière suivante : • L'enregistrement correspond à la totalité de l'enregistrement à transcrire. • L'enregistrement est découpé en sections, délimitant les parties de l'entretien à transcrire ou les parties non-transcrites. • À l'intérieur d'une section on va distinguer les tours de parole (turn) qui correspondent à des changements de locuteur. • Les tours de paroles sont eux-mêmes découpés en segments plus courts au moyen de points de synchronisation. La transcription proprement dite n'intervient qu'à ce niveau de structuration. 3.2 Paramétrage de Transcriber • Démarrez Transcriber (cf. manuel de référence de Transcriber) • Réglez l'encodage des caractères utilisé pour vos transcriptions à Unicode : [Options]/ [Général]/[Encodage] : → Unicode (UTF-8). Ce réglage est nécessaire pour l'exploitation des données ensuite dans le logiciel d'analyse textométrique TXM. • Chargez le fichier des identifiants des locuteurs fourni dans le cours (LocuteursTranscriber.trs) : [Edition]/[Locuteurs]/[Importer à partir du fichier...] • Il peut également être utile de paramétrer Transcriber pour que la portion du signal sélectionné soit jouée automatiquement dès la sélection [Options]/[Fichier son]/[Rejoue automatiquement la sélection]. • N'oubliez pas de régler la langue de vos transcriptions pour le correcteur orthographique français dans [Options]/[General]/[Language:] → French. 6 • Enregistrez la configuration avec [Options]/[Enregistrer la configuration], afin de réouvrir automatiquement ces fichiers au prochain démarrage 3.3 Comment transcrire un nouvel enregistrement ? • Démarrez Transcriber (cf. manuel de référence de Transcriber) • Créez une nouvelle transcription avec le menu [Fichier]/[Nouvelle transcription]. Une fenêtre de dialogue propose de choisir le fichier son à transcrire. • Il est conseillé d'ajuster la hauteur du signal avec le panneau de contrôle audio [Signal]/ [Panneau de contrôle]/[Zoom vertical (dB)] de sorte à ce que le grapĥique du signal occupe tout l'espace disponible pour faciliter le repérage dans l'enregistrement audio. • Enregistrez la nouvelle transcription vide avec [Fichier]/[Enregistrer sous] : ajuster si besoin l'emplacement du fichier pour savoir retrouver le fichier facilement, et renommer le fichier avec l'identifiant de la personne interviewée (ex. int07.trs pour l'entretien avec la personne dont l'identifiant est int07). Attention à reprendre scrupuleusement la forme de l'identifiant (ex. Int07.trs, INT07.trs, int7.trs, interviewe7.trs ne conviennent pas). • Par la suite, pensez à enregistrer fréquemment votre travail avec [Fichier]/[Enregistrer] ou le raccourci Control-s, surtout si vous n'avez pas activé la sauvegarde automatique de transcriber (cette sauvegarde est activable et réglable dans [Options]/[General]). 3.4 Segmentation du signal Pour fournir des repères temporels par rapport au signal, et pour faciliter le travail de transcription, on segmente le signal en insérant des balises temporelles instantanées de synchronisation (ou frontières). 3.4.1 Où segmenter ? Nous recommandons de faire correspondre ces balises à des groupes de souffle dans uploads/Management/ guide-de-transcription-d-entretiens-transcriber-txm-0-3-fr 1 .pdf
Documents similaires










-
26
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jan 16, 2021
- Catégorie Management
- Langue French
- Taille du fichier 0.5010MB