cours de traitement du signal avancé Traitement de la parole H. BELKEBIR1 E-mai
cours de traitement du signal avancé Traitement de la parole H. BELKEBIR1 E-mail: hicham.belkebir@usmba.ac.ma 1Département Génie Électrique et Informatique École Nationale des Sciences Appliquées - Fes Université Sidi Mohamed Ben Abdellah Support de cours de la filières GTR2, 2017-2018 Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 1 / 14 ensaf-logo Plan du cours 1 Introduction 2 traitement numérique du signal Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 2 / 14 ensaf-logo Organisation du Cours 28 H de cours et travaux dirigés : ⇒4 séances de 4 H de cours de traitement de signal avancé (TSA); Travaux pratiques : ⇒3 séances de TP par groupe; Évaluation : ⇒Contrôle continue au début de chaque séance de cours (à partir de la deuxième séance). ⇒Mini-projet de traitement de signal avancé. ⇒Examen écrit de validation des acquis. Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 3 / 14 ensaf-logo Pré-requis du Cours Physique et mathématiques (CP1 et CP2); statistique et processus stochastique; (1ére année GTR) informatique (POO) ; traitement de signal. Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 4 / 14 ensaf-logo Introduction Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 5 / 14 ensaf-logo Introduction Qu’est ce que la parole ? Définition 1: "la parole est le fait de s’exprimer par le langage articulé" (dictionnaire Larousse); Définition 2: "Ensemble de Mots ou phrases prononcées pour exprimer une pensé, un sentiment ··· (dictionnaire Larousse); Définition 3: "Usage concret de la langue (système abstrait) par les locuteurs" (selon les linguistiques) Définition 4: sur le plan technique, la parole est un signal acoustique produit par le système phonatoire pour servir de support physique à l’information généré par le cerveau de L’être humain. Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 6 / 14 ensaf-logo Introduction Pourquoi le traitement du signal de la parole ? Pour certaines application, la parole constitue la seule modalité d’accès à l’information (exemple: communications téléphoniques). Pour d’autres, elle occupe le rôle de modalité complémentaire (exemple: contrôle vocale des systèmes); l’Intérêt d’utiliser la parole comme moyen de communication réside dans le fait que c’est une modalité riche d’un point de vue informationnel; la parole est un signal acoustique sur lequel on a imprimé l’intelligence généré par notre cerveau par l’intermédiaire d’un mode de production très complexe. il en résulte, la nécessité de développer des techniques et des méthodes appropriés pour : Préserver le contenu informatif du signal de la parole; élaborer des modèles qui facilite la représentation de ce signal; production artificiel du signal de la parole; Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 7 / 14 ensaf-logo Introduction Domaines d’application Reconnaissance de la parole (ASR) : ⇒Parole interactive (dialogue); ⇒Dictée vocale ; Reconnaissance du locuteur : ⇒Vérification ou identification ; ⇒Dépendante ou indépendante du texte ; Synthèse de la parole : À partir du texte (text to speech synthesis) ; Synthèse par règle →par concaténation →sélection d’unités Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 8 / 14 ensaf-logo Traitement numérique du signal Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 9 / 14 ensaf-logo traitement numérique du signal représentation du signal de la parole signal acoustique : est produit par le système phonatoire humain. Il s’agit d’un signal analogique ayant un spectre qui couvre l’intervalle de fréquence s’étalant de 20[Hz] à 20 [KHz] : signal électrique : est le fruit de la transduction du signal acoustique en signal électrique à l’aide de transducteurs spécifiques (microphone). On admet que le signal électrique conserve les traits caractéristiques du signal acoustique; signal numérique : est le résultat de la numérisation du signal acquis par le transducteur par le moyen d’un convertisseur analogique numérique. Le signal de la parole issue de cette étape est caractérisé par la fréquence d’échantillonnage Te et la résolution du CAN (nombre de bits utilisé pour quantifier l’amplitude du signal); Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 10 / 14 ensaf-logo traitement numérique du signal système de traitement Filtre : est un système linéaire temporellement invariant qui introduira des modifications temporelles ou spectrales sur le signal afin de l’adapter aux spécifications du système d’exploitation; Convolution numérique: est l’opération réalisé par le filtre pour transformer le signal se présentant à son entrée : x(n) Filtre H y(n) y(n) = x(n)∗h(n) = X m x(m)h(n −m) Chaque filtre est caractérisé par sa réponse impulsionnelle h(n) : δ(n) Filtre h(n) Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 11 / 14 ensaf-logo traitement numérique du signal transformée en z définition : soit un signal numérique x(n), on définit la transformée en z bilatérale par l’expression : X(z) = X n x(n)z−n X(z) existe si P n |x(n)||z−n| < ∞. La transformée inverse est donnée par : x(n) = 1 ı2π I X(z)zn−1dz Région de convergence: Soit R1 et R2 deux réels tel que X(z) n’existe que : ∀z ∈C C C : R1 < |z| < R2 Alors l’ensemble des z vérifiant cette condition forme la région de convergence de X(z); Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 12 / 14 ensaf-logo traitement numérique du signal exemples impulsion de Dirac δ(n) : Z Z Z {δ(n)} = 1 impulsion avec retard δ(n −k) : Z Z Z {δ(n −k)} = z−k échelon unité u(n) : Z Z Z {u(n)} = 1 1−z−1 porte u(n)−u(n −N) : Z Z Z {ΠN(n)} = 1−z−N 1−z−1 puissance anu(n) : Z Z Z {anu(n)} = 1 1−az−1 Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 13 / 14 ensaf-logo traitement numérique du signal propriétés de la transformée en z séquence transformée en z 1. Linéarité ax(n)+by(n) aX(z)+bY (z) 2. Retard x(n −k) z−kX(z) 3. Avance x(n +k) zkX(z) 4. Pondération linéaire nx(n) −z dX(z) dz 5. Pondération exponentielle anx(n) X(a−1z) 6. Inversion temporelle x(−n) X(z−1) 7. Convolution x(n)∗y(n) X(z)Y (z) 8. Multiplication x(n)y(n) 1 ı2π H C X(µ)Y ( z µ)µ−1dµ Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 14 / 14 ensaf-logo Modèle numérique du signal de la parole Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 15 / 14 ensaf-logo modèle numérique du signal de la parole Processus de production de la parole Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 16 / 14 ensaf-logo Analyse spectrale du signal de la parole Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 17 / 14 ensaf-logo Analyse spectral du signal de la parole Analyse de Fourier à temps court Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 18 / 14 ensaf-logo Analyse spectral du signal de la parole Analyse homomorphique Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 19 / 14 ensaf-logo Modélisation paramétrique du signal de la parole Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 20 / 14 ensaf-logo modélisation paramétrique du signal de la parole prédiction linéaire Hicham BELKEBIR (ENSAF) Traitement de la parole M25 2018 21 / 14 uploads/Sante/ tna-1.pdf
Documents similaires










-
34
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jan 12, 2022
- Catégorie Health / Santé
- Langue French
- Taille du fichier 0.1815MB