1 Reconnaissance vocale Reconnaissance vocale Comment la reconnaissance vocale
1 Reconnaissance vocale Reconnaissance vocale Comment la reconnaissance vocale est-elle possible ? SOLA Elisabeth TIPE 2017 2 Différentes étapes ●I. Représentation d'un mot ●II. Modèle prédictif 3 Définition et but Parole : variation de la pression de l'air causée par le système articulatoire But : permettre la communication vocale homme-machine 4 Différentes approches ●2 méthodes : *globale : mots entiers isolés *analytique : phonèmes, phrases ●Ajout d'un modèle prédictif Micro Acquisition CAN Prétraitement Comparaison Décision Modèles mots 5 Représentation d'un mot ●Différences visibles dans le spectre Allure du spectrogramme du mot 'oui' sous Audacity Allure du spectrogramme du mot 'soleil' sous Audacity 1) Différencier les mots 6 ●Utilisation de la transformée de Fourier Mot il Mot Beau Lettre A Mot Oui 6 7 ●Les limites de la transformée de Fourier 3 enregistrements du mot il 8 ●Donc limites de la transformée de Fourier : → Spectres très semblables : confusions possibles → Système mono-locuteur → Base de données très réduite → Nombre de données à traiter limité (donc mots courts) 9 2) L'analyse cepstrale ●L'échelle Mel : plus proche de l'ouïe humaine ●Principe des MFCC 10 3) Caractéristiques d'un mot Exemple de banc de filtres 11 Modèle prédictif ●Ressemblance entre mots différents ●Différences lors de la prononciation d'un même mot → Erreurs possibles, confusions → Résultats non satisfaisants → Nécessité d'un modèle prédictif 12 1) Matrice de probabilités ●Moyenne de plusieurs enregistrements pour chaque mot : espace à n=6 dimensions ●Calcul de la distance minimale entre le mot Test et chacun des autres mots 13 Définir une probabilité ●Probabilité d'obtenir chaque mot ●Prédiction du mot suivant Exemple de matrice de probabilités 14 2) Résultat expérimental ●Exemple : mot Soir ●Résultats corrects à 51% Matrice des probabilités obtenue Mot suivant prédit Fait Il Tu Beau Ce Soir 14 15 Conclusion ●Transformée de Fourier insuffisante ●Méthode des coefficients cepstraux : satisfaisante mais confusions toujours possibles ●Amélioration du résultat par le calcul des probabilités d'avoir chaque mot ●Prédiction du mot suivant ●Mais base de données limitée et système mono-locuteur 16 Bibliographie Webographie ●Dan Jurafsky, web.stanford.edu, Spoken Langage Processing ●Vincent ARSIGNY , http://www-sop.inria.fr ●Philippe Foucher, http://www2.univ-paris8.fr ●James Lyons, Pratical Cryptography, http://practicalcryptography.com ●Wikipédia, Reconnaissance automatique de la parole Bibliographie ●Steven B. Davis, ieee transactions on acoustics, speech, and signal processing ●Rodolphe BATTAULT, Examen Probatoire pour l'obtention du Diplôme d'Ingénieur du C.N.A.M ●Luiza Orosanu, Thèse : Reconnaissance de la parole pour l'aide à la communication pour les sourds et malentendants ●Abdenour Hacine-Gharbi, Thèse : Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole Laboratoire du Loria Mme Odile Mella (Maître de Conférences Université de Loraine) Laboratoire du LIMSI Mr Gilles Adda (Groupe traitement du langage parlé) Voxolab Mr Vincent Jousse (Maître de conférences associé à l'Université du Mans, CEO Voxolab) 17 Annexe 17 18 18 19 19 20 uploads/Philosophie/ 18-p.pdf
Documents similaires
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/cfdAfgzxREoln73UmwHltQKvneSwu4nUULUb5GERAiHSg2BWZkLw5LLo4ARoKW76DOUbzAF2ZNEBSEoUYJzB4Qd6.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/2dwGN5ez2FraXFjDJJgUShWyrQY7YOCHWGT3XW5jrmOU51MwWBFeMcq80W5ehRvGu1FGz0G7lEOeBneciuoH5ltQ.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/JjLspoimIYBFeRb5PgCsB3dz0MZ9UBqA3STNqpnO3gWUh6oevqmzmmUvib6I7X69FmamJqRGhZL8XXYn3QCjtgWS.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/iz0wZzbXr1j6vzWmd0qSaR2xab5bv6q3a0pkwYrMwkB1cq3Rr5oNJdnncx9mXU0XPWEJOL2kp0PtsqjlWRQwzf8T.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/9Kjk4AWsHG4v9XrqGsdFkNJAdeN2qhuJZo2O7jqPJaBxjMB5CS7CAa5L46UIpyxwJkDfFWPhXtcvoGqYFRcbyWDk.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/d9o2LDxDuGXQO2kCi92Va1ezDIuUzOZ48RFCgGhZsmjIVkTce1ofaf6qm6qr1GzwKS4q4YlFupwkTXXDciAipfgQ.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/8F0oPkWSxHLFTtu4KUXsknusRYPi3qG5AN0X5hwMjg3ZYeR96iOlOaTdtPFjp4yKiIcGRx5Ce388XK93JyYIi8ZK.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/5krpdNwG7IZ3UH1HUP3STzcosT0c2m8nGqqm2bCDe5InVKwTnWvUGTectezaZ0ViSFj3O0SknPHCAwaanq4Ybk3F.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/Qphwy5qMmGGG1GLMK8KFm99dXTAjPvX35pzFzHxQ08LLvE3H6327wDL3Zv3bP9KEJCxQHWejSxZgfSFMWr6BEYkc.png)
![](https://b3c3.c12.e2-4.dev/disserty/uploads/preview/QeQdsE5oLNEvSwdh9TOiBvmuSjuvvtOvxRZ3oEI43woKJ1NuJrUepWS2rCdrusnINzoYI9wakHIlUK1tZVxwj3yB.png)
-
25
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jan 18, 2022
- Catégorie Philosophy / Philo...
- Langue French
- Taille du fichier 2.7088MB