Arena romanistica dister simon
La transcription synchronisée des corpus oraux Un aller-retour entre théorie méthodologie et traitement informatisé Anne DISTER et Anne Catherine SIMON Centre de recherche VALIBEL ?? UCLouvain anne dister anne-catherine simon uclouvain be Résumé Les corpus oraux ont pour particularité qu ? aux données primaires les enregistrements s ? ajoutent des données secondaires les transcriptions nécessaires à leur exploitation Cet article examine les conséquences sur les conventions de transcription à adopter de l ? évolution des outils informatisés pour l ? exploitation des corpus oraux l ? implication qu ? ont les conventions de transcription sur les types de requêtes et d ? analyses qu ? on peut mener sur les données comment la transcription synchronisée en alignant le texte et le son facilite l ? accès au son mais introduit un artéfact dû au choix d ? une unité temporelle d ? alignement De manière plus particulière cet article examine l ? évolution des conventions de transcription et d ? alignement utilisées dans la banque de données VALIBEL et analyse les problèmes et les conséquences de ces conventions pour l ? annotation et la recherche linguistique sur corpus Grands principes des conventions de transcription Toute analyse linguistique de productions orales est impossible à partir de la seule source sonore En e ?et le chercheur aura beau écouter et réécouter encore les enregistrements il ne peut les appréhender uniquement par le biais du son Ceux-ci ne pourront devenir objets d ? étude à part entière qu ? à partir de leur mise en par écrit La parole reste uide essentiellement fugace même après avoir été captée sur bande sonore On ne peut pas étudier l ? oral par l ? oral en se ?ant à la mémoire qu ? on en garde On ne peut pas sans le secours de la représentation visuelle parcourir l ? oral en tous sens et en comparer les morceaux Blanche- Benveniste Cet article a béné ?cié des commentaires éclairants de Michel Francard et de Philippe Hambye Toute erreur ou imprécision y subsistant est à attribuer à la seule responsabilité des auteures Avec le logiciel Praat Boersma et Weenink COn est donc là devant un paradoxe mis en évidence par de nombreux chercheurs Blanche-Benveniste et Jeanjean Blanche-Benveniste et Gadet Raingeard et Lorscheider pour approcher l ? oral on doit en passer ? par l ? écrit Dès ses débuts en le centre de recherche VALIBEL acronyme pour Variétés Linguistiques du français en Belgique qui constitue et exploite de grands corpus oraux a ré échi à ses pratiques de transcription et établi des conventions de transcription explicites Celles-ci ont d ? emblée suivi quatre grands principes adoption de l ? orthographe standard non-recours à la ponctuation de l ? écrit valorisation de l ? oralité des corpus et compatibilité avec un traitement informatisé Adoption de l ? orthographe standard Pour les recherches linguistiques autres que celles concernant directement la forme phonique phonétique phonologie prosodie VALIBEL transcrit en utilisant l ? orthographe traditionnelle Ceci est loin d ?
Documents similaires










-
33
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Aoû 07, 2021
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 108.7kB