Chapitre 9 Algorithmes et techniques pour l’analyse musicale 9.1. Introduction
Chapitre 9 Algorithmes et techniques pour l’analyse musicale 9.1. Introduction L’interprétation d’un phénomène musical complexe suppose d’être capable, consciemment ou non, de le décomposer et d’établir des liens entre ses éléments. La notion de structure musicale est prise ici dans le sens de l’organisation attribuée à une surface musicale1 en termes de parties et de relations/fonctions entre elles à divers niveaux de description. L’analyse musicale vise la révélation de ces descriptions structurelles, souvent d’un point de vue perceptif/cognitif (Plié, 1980). On emploie souvent des méthodologies informatiques pour étudier les processus analytiques musicaux en eux-mêmes et également pour construire des outils d’analyse utilisables dans des applications musicales pratiques comme l’exécution interactive, la composition assistée par ordinateur, la recherche et l’indexation de données musicales, l’expressivité de l’exécution automatique, etc. Dans ce dernier cas, le principal argument est que plus on vise des applications informatiques musicales sophistiquées, plus le système informatique doit « comprendre » les structures musicales. Chapitre rédigé par Emilios CAMBOUROPOULOS et Pierre-Yves ROLLAND. 1. La surface musicale est considérée comme « le plus bas niveau de représentation ayant une signification musicale » [JAC 87, p. 219]. Par commodité, elle est considérée ici comme une séquence de notes discrètes représentées de façon symbolique, sans éléments structurels de plus haut niveau (marques d’articulation, signature rythmique, etc.) 312 Informatique musicale Il existe différents points de vue sur la façon de créer des modèles informatiques pour les tâches musicales. Une distinction entre les stratégies de modélisation est basée sur la quantité de connaissances explicites directement intégrée dans la représentation informatique [CON 95] : dans l’approche relevant de l’ingénierie des connaissances, la représentation est entièrement codée « manuellement » par le programmeur-théoricien sur la base de connaissances musicales intuitives ou explicites (par exemple dans les manuels d’enseignement de la musique), alors que dans l’approche relevant de l’induction empirique, la représentation est élaborée à partir de généralisations sur un ensemble de phénomènes musicaux d’après divers principes fondamentaux généraux et diverses stratégies. Du fait de la diversité de styles et de « langages » de la musique, les chercheurs ont souvent eu recours à la première approche, avec laquelle ils ont construit des systèmes experts complexes pour effectuer des tâches analytiques particulières dans des domaines musicaux spécialisés (par exemple le contrepoint du XVIe siècle dans le style de Palestrina, l’harmonie tonale du XVIIIe siècle, l’analyse schenkérienne, l’analyse timbrale du XXe siècle pour la musique atonale, l’harmonie du jazz, des systèmes correspondant à divers genres musicaux traditionnels, etc.). D’autre part, certains chercheurs ont essayé de construire des systèmes inductifs et moins dépendants de styles musicaux spécifiques ; ces approches utilisent souvent des techniques d’apprentissage automatiques, des méthodologies relevant de la théorie de l’information, des principes et modèles cognitifs, etc. Ce chapitre donne une description brève des modèles relevant de la deuxième stratégie, car ils sont habituellement plus généraux et peuvent être appliqués à des styles et idiomes musicaux variés. Divers modèles informatiques pour des tâches analytiques mélodiques seront décrits par une série d’exemples musicaux. La plupart de ces techniques peuvent être adaptées et appliquées aux fichiers musicaux polyphoniques en tenant compte de paramètres complémentaires (par exemple l’harmonie : on considère un passage musical comme une série d’accords) ou si l’on dispose d’algorithmes de séparation de voix permettant de décomposer un passage polyphonique en plusieurs « mélodies » indépendantes (voir l’aperçu donné dans [TEM 01]). En supposant que la mélodique est présentée sous la forme d’une séquence de notes ayant des valeurs nominales, les modèles informatiques présentés ici répondent aux questions suivantes : a) comment détecter les frontières locales pour commencer à segmenter une mélodie ? b) comment détecter les structures accentuelles et métriques ? c) comment détecter des patterns musicaux significatifs ? d) quel est l’effet de la similitude musicale sur la segmentation mélodique ? e) comment organiser les segments musicaux en catégories « significatives » (par exemple motifs et thèmes) ? Algorithmes et techniques 313 Ce chapitre a pour but de présenter des stratégies permettant de résoudre ces problèmes d’analyse musicale, non de signaler les meilleurs algorithmes (il existe peu d’algorithmes suffisamment testés et peu d’études comparatives, car la musicologie informatique en est toujours à un stade peu avancé). Pour illustrer le propos de façon simple, il illustre l’application d’une série d’algorithmes d’analyse à une mélodie simple, mentionne d’autres méthodes possibles et fournit quelques exemples supplémentaires. 9.2. Frontières locales Les principes de la Théorie de la forme (Gestalttheorie) relativement à l’organisation de la perception, sont un ensemble de règles pratiques portant sur les modes préférentiels de groupement des événements (notamment visuels) en schémas de plus grande échelle. Selon deux des principes de Gestalt relativement aux données de bas niveau, les objets proches (principe de Proximité) ou similaires (principe de similitude) tendent à être perçus comme des groupes. Ces principes sont à la base de divers modèles récents de détection des frontières locales dans les séquences mélodiques. Par exemple, dans le modèle de Tenney et Polansky [TEN 80], les principes de Proximité et de Similitude sont pris comme des descriptions différentes du même phénomène, à savoir un maximum local de la distance entre événements musicaux consécutifs pour n’importe quel paramètre musical, par exemple la hauteur et l’instant initial de la note. Une mélodie donnée est représentée par une séquence d’intervalles de hauteur (en demi-tons) et par une séquence d’intervalles entre instants initiaux (exprimés en multiples de la plus petite unité de durée adéquate ; dans l’exemple ci-dessous il s’agit de doubles-croches). On calcule alors la somme de chaque paire correspondante de données dans les deux séquences de valeurs, et les maximums locaux de la série de sommes sont considérés comme les frontières les plus probables (figure 9.1b). Le modèle de règles de regroupement locales de Lerdahl et Jackendoff [LER 83] essaie lui aussi de repérer les maximums locaux dans les séquences d’intervalle paramétriques. Ce modèle propose des règles plus variées, mais elles sont binaires (aucune valeur ne leur est associée), par exemple : – GRP2b : un intervalle entre instants initiaux est perçu comme une frontière locale s’il est plus grand que le précédent et que le suivant ; – GPR3a : un intervalle de hauteur est perçu comme une frontière locale s’il est plus grand que le précédent et que le suivant ; 314 Informatique musicale – GPR3d : dans une séquence de quatre notes, on perçoit une frontière entre les deux notes centrales si les deux premières et les deux dernières notes ont la même durée si les deux notes du milieu ont des durées différentes. Une règle complémentaire d’intensification indique que si plusieurs règles de détail locales s’appliquent dans une position donnée, la frontière locale correspondante est plus marquée. Un exemple est donné dans la figure 9.1a (où seules interviennent les trois règles ci-dessus). Ce modèle a été très influent ; beaucoup d’applications informatiques ont adopté et adapté les règles de Lerdahl et Jackendoff pour la segmentation (par exemple [TEM 01]). Ce modèle, évalué expérimentalement, s’est avéré très fiable [DEL 87]. Selon Cambouropoulos [CAM 96, CAM 97], bien que cette formalisation des principes de la Gestalttheorie (un grand intervalle situé entre de petits intervalles) fournisse le principal facteur de découverte des frontières locales, une approche plus générale se devrait de représenter n’importe quel changement d’échelle des intervalles. Par exemple, dans la séquence de durées , un auditeur entend facilement un point possible de segmentation alors qu’aucun des deux modèles précédents ne suggère de frontière. Le modèle de segmentation que nous proposons et que nous appelons modèle de détection de frontières locales (MDFL, en anglais Local Boundary Detection Model LBDM) est basé sur deux règles : la règle de changement d’identité et la règle de proximité. La règle de changement d’identité est plus simple que tous les principes de la Gestalttheorie, car elle est applicable à partir de deux entités (c’est-à-dire qu’elle permet de juger si deux entités sont identiques ou non), tandis que la règle de proximité exige au moins trois entités (deux entités sont jugées plus proches ou plus similaires que deux autres entités) : – règle de changement d’identité (RCI) : les frontières peuvent être présentées sur n’importe lequel de deux intervalles consécutifs si ces intervalles sont différents. Si les deux intervalles sont identiques, aucune frontière n’est suggérée ; – règle de proximité (RP) : si deux intervalles consécutifs sont différents, la frontière présentée sur le plus grand intervalle est proportionnellement plus forte. Le modèle de détection de frontières locales suggère toutes les positions possibles des frontières locales sur une surface musicale, avec divers degrés de relief. Les valeurs sont normalisées sur l’intervalle [0,1]. Les sommets locaux sont les points les plus susceptibles d’être perçus comme des frontières locales (voir l’exemple de la figure 9.1a et la description formelle de l’algorithme en annexe, A.1). Une description détaillée de l’algorithme est donnée dans [CAM 01a]. Le MDFL, appliqué à de nombreuses mélodies, a fourni de très bons résultats. Une évaluation de ce modèle est présentée dans [BAT 98 ; HOT 02]. Algorithmes et techniques 315 Figure 9.1. Trois patterns de frontières locales appliqués à uploads/Geographie/ algorithme-et-technique-pour-l-x27-analyse-musicale.pdf
Documents similaires
-
100
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Mar 23, 2021
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 0.3302MB