Reconnaissance des mots isoles par htk
Reconnaissance des mots isolés par HTK Commande vocale du robot mentor en temps réel KHENFER KOUMMICH Fatima Laboratoire LAPESA Département de l ? électronique USTO -MB Oran Algérie Fatimakhanfar yahoo fr HENDEL Fatiha MEDDBER Lila Abstract ?? la reconnaissance de parole est une technique informatique qui permet la communication entre l'homme et la machine o? les hommes se sentiront plus confortables pour télé opérer un robot dans ce papier on présente une approche en utilisant les modèles de Markov caché HMM Hidden Markov Model utilisée sous forme des outils de Markov caché HTK Hidden Toolkit appliquée sur les commandes de robot pour ce faire une modélisation acoustique appliquée sur ces mots pour extraire les information pertinentes Ensuite ces paramètres seront utilisés dans les phases d'apprentissage et de reconnaissance Le but d'utiliser le HTK car il est plus performant a ?n d'obtenir un taux de reconnaissance élevé et l'un des avantages de ce outil est qu ? il peut être facilement adapté à une nouvelle liste de commandes Mots clé ??HMM Hidden Markov Model HTK Hidden Toolkit MFCC Mel-Frequency Cepstral Coe ?cients Reconnaissance vocale ?? ? INTRODUCTION La parole étant le mode de communication privilégié de l ? homme il est indispensable d ? équiper un robot d ? assistance d ? un système lui permettant d ? e ?ectuer des t? ches simples ou complexes en suivant les instructions orales de son utilisateur Les modèles HMMs peuvent être utilisés à plusieurs niveaux linguistiques pour modéliser la parole phonèmes syllabes mots ? L ? unité la plus naturelle pour e ?ectuer la reconnaissance de la parole est le mot Les modèles de mots permettent une bonne modélisation de la coarticulation à l ? intérieur du mot Les HMMs béné ?cient d ? algorithmes d ? entra? nement et de décodage performants ?? ?? ? PRETRAITEMENTS Avant de pouvoir modéliser un signal quel qu ? il soit une première étape indispensable consiste à e ?ectuer divers prétraitements a ?n d ? extraire du signal des vecteurs de données pertinentes capables d ? alimenter un algorithme de reconnaissance Ces traitements standards en traitement de signaux sonores échantillonnage transformée de Fourrier rapide Fig puis plus spéci ?ques à la parole sont e ?ectués a ?n d ? obtenir une séquence de vecteurs acoustiques qui forment l ? entrée de l ? algorithme de reconnaissance Ces vecteurs sont appelés MFCCs Mel Frequency Cepstrum Coe ?cient en référence à l ? échelle de Mel qui est utilisée ici plutôt qu ? une échelle fréquentielle classique car basée sur la perception humaine des sons qui est non-linéaire Cette relation est donnée par la formule mel f ? log ? f Avec f la fréquence en Hz De plus dans le but de rendre la reconnaissance plus robuste notamment au bruit on rajoute souvent au vecteur la vitesse ? et l ? accélération ? de ces MFCCs c ? est-à-dire les dérivées et dérivées secondes du vecteur On peut également y rajouter un terme d ? énergie E
Documents similaires










-
51
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Aucune attribution requise- Détails
- Publié le Mai 13, 2021
- Catégorie Philosophy / Philo...
- Langue French
- Taille du fichier 53.3kB