1 PFE 4102 Introduction général Dans la nature humaine, parler est un besoin, l
1 PFE 4102 Introduction général Dans la nature humaine, parler est un besoin, l'un des plus élémentaires peut-être. Il en est le plus distinctif de par sa forme, son impact et surtout de par sa variabilité. Les différents peuples communiquent dans leurs langues maternelles. Ils apprennent à leurs progénitures dès leurs naissances, les mots, les intonations, les phrases, les manières de dire les choses, de décrire les objets et ceci d'une part, pour uniformiser leur parler et d’autre part, pour développer leur présence et renforcer leur existence. Les différentes langues se diffèrent, certes, par leur vocabulaire, grammaire et leur prononciation. Mais l'unicité du canal vocal et des différents articulateurs vocaux, les aligne à pied égal. Toutefois, ce moyen de communication peut être affecté de certaines anomalies que l’on définit par pathologie du langage. Celle-ci doit être traitée pour pouvoir communiquer. Généralement ces anomalies touchent surtout l’appareil articulatoire par conséquent il nécessite différentes thérapies. Le traitement de la parole est aujourd’hui une composante fondamentale des sciences de l’ingénieur. Situé au croisement du traitement du signal numérique et du traitement du langage. Cette discipline scientifique a connu une expansion fulgurante liée au développement des moyens et des techniques de télécommunication. L’importance particulière du traitement de la parole dans ce cadre plus générale s’explique par la position privilégiée de la parole comme vecteur d’information dans notre société humaine. L’extraordinaire singularité de cette science qui la différencie fondamentalement des autres composantes du traitement de l’information, tient sans aucun doute un rôle fascinant que joue le cerveau humain à la fois dans la production et dans la compréhension de la parole et à l’étendue des fonctions qu’il met, inconsciemment en œuvre, pour y parvenir de façons pratiquement instantanée. Notre étude s’intègre dans un cadre générale du développement des systèmes de reconnaissance des phonèmes par classification bayésienne pour cela on a expose quelques méthodes de classification et présente cette classification à l’aide de l’algorithme k-means et viterbi Notre projet est par conséquent organisé de la manière suivante : - Le premier chapitre consacré aux généralités sur le signal de parole ; - Le deuxième chapitre résume les notions théoriques de probabilité et des modèles Gaussien ainsi que, les différentes étapes du fonctionnement des algorithmes entrainés et expérimentés; - Le troisième chapitre expose les expériences réalisées, ainsi que les résultats obtenus et leurs interprétations Nous terminerons Cette mémoire par une conclusion qui résume les résultats obtenus au cours de notre travail. Chapitre I Généralité sur le Signal de Parole 1.1 Introduction La parole est la capacité de l'être humain de communiquer la pensée par l’intermédiaire de sons articulés. Dû à son importance, la parole a préoccupé depuis toujours les scientifiques. Ainsi quelques-unes des sciences qui se préoccupent de l'étude de la parole ont déjà des centaines d'années. Dans ce chapitre on va voir une approche générale sur l’identité du signal de parole commençant par tout ce qui concerne sa production y compris l’architecture de l’appareil vocal, le mécanisme de la phonation et la classification des phonèmes seront aussi abordé dans le contenu de ce chapitre. Nous allons aussi voir le niveau acoustique du signal de parole particulièrement son spectre sa fréquence fondamentale son énergie….etc. 1.2 Production de Parole D’un point de vue mathématique, il est difficile de modéliser le signal de parole, compte tenu de sa variabilité. Le signal de parole s(n) est le résultat de l’excitation u(n) du conduit vocal par un train d’impulsion ou un bruit avec un gain G donnant lieu respectivement aux sons voisés et non voisés (la figure 1). Dans le cas des sons voisés, l’excitation est une vibration périodique des cordes vocales suite à la pression exercée par l’air provenant de l’appareil respiratoire. [20] Générateur D’impulsions Sons voisés Modèle du U(n) Conduit vocal G Générateur Sons non-voisés De bruit Figure (1.1) : Modèle Simple de Production de Parole 1.2.1 Architecture de l’Appareil Vocal L’appareil vocal, ou système phonatoire, comprend quatre éléments fondamentaux fonctionnant en étroite synergie pour produire des signaux acoustiques. Ce sont, dans l’ordre où ils s’élaborent La soufflerie Le vibrateur Le corps sonore Le système articulateur La soufflerie est constituée d’un réservoir d’air, les poumons, actionnés par les muscles du thorax et de l’abdomen, et d’un tube, la trachée artère, qui conduit l’air aux cordes vocales ; le vibrateur est le larynx, qui engendre les ondes aériennes; le corps sonore est constitué d’un ensemble complexe de résonateurs, dont le pharynx et la bouche sont les principaux; le système articulateur, enfin, se compose d’éléments fixes et mobiles permettant de modifier largement la forme de l’onde laryngée. Tous ces éléments sont placés sous la dépendance étroite du système nerveux central, qui en assure le synchronisme et la coordination [1]. Figure (1.2) : Appareil Vocal 1.2.1.1 Soufflerie et Vibration L’air est la matière première de la voix. Si le fonctionnement de notre appareil vocal est souvent comparé à celui d’un instrument de musique, il doit être décrit comme celui d’un instrument à vent. En effet, en expulsant l’air pulmonaire à travers la trachée, le système respiratoire joue le rôle d’une soufflerie. Il s’agit du « souffle phonatoire » produit, soit par l’abaissement de la cage thoracique, soit dans le cadre de la projection vocale par l’action des muscles abdominaux [3] 1.2.1.2 Larynx Le larynx constitue l’extrémité supérieure de la trachée artère, situé à la hauteur de la sixième vertèbre cervicale (chez l’adulte). C’est un assemblage de cartilages articulés, reliés entre eux par des ligaments et des muscles (dont les cordes vocales), l’ensemble étant tapissé d’une muqueuse *1+. 1.2.1.3 Corps Sonore Les résonateurs du système phonatoire sont, pour l’essentiel, responsables du timbre de la voix. Leur originalité par rapport aux caisses de résonance des instruments de musique traditionnels est leur faculté de changer, grâce à un réseau musculaire dense et élaboré, — dans de larges proportions, et très rapidement — de forme et de volume, assurant ainsi au son vocal une variété acoustique sans équivalent. Figure (1.3) : Vue Schématique Antérieure du Larynx. Les résonateurs sont au nombre de cinq : le pharynx, la cavité buccale divisée en deux, la cavité labiale, et la cavité nasale. Tous communiquent entre eux par des ouvertures de tailles réglables. Tapissés de muqueuse, ils sont peu amortis. Les sinus de la face, contrairement à une croyance largement répandue, sont trop petits pour se comporter en résonateurs, et n’ont d’ailleurs aucune fonction reconnue dans la phonation [1]. 1.2.1.4 Système Articulateur Il intègre un ensemble d’organes mobiles, le voile du palais, la mâchoire inférieure (ou mandibule), la langue et les lèvres. Les mouvements de la mâchoire inférieure contribuent largement aux variations de volume de la bouche. La langue, reliée par sa base à l’os hyoïde, est extrêmement mobile, car commandée par dix-sept muscles (huit pairs et un impair) ; elle prend appui sur différents points du conduit pharyngo-buccal pour articuler les phonèmes. Ces points d’articulation sont *1+ : les lèvres (articulations labiales ou bilabiales) les dents (articulations dentales) les alvéoles 16 (articulations alvéolaires) le palais dur, ou partie osseuse de la voûte (articulations palatales) le voile du palais ou « palais mou » (articulations vélaires) la luette (articulations uvulaires) le pharynx (articulations pharyngales) la glotte (articulations glottales) 1.2.2 Mécanisme de Phonation L'une de plus importantes caractéristiques du signal vocal est la nature de l'excitation. Il existe deux types élémentaires d'excitation qui produisent les sons voisés et non voisés. 1.2.2.1 Phonation de Sons Voisés Les sons voisés sont produits à partir d'une excitation qui actionne sur le conduit vocal et qui consiste en une suite d'impulsions périodiques d'air fournies par le larynx. Les cordes vocales au début sont fermées. Sous la pression continue de 1'air qui vient des poumons elles s'ouvrent graduellement délivrant cette énergie potentielle. Pendant cette ouverture la vitesse de l'air et l'énergie cinétique augmentent jusqu'à ce que la tension élastique des cordes vocales égale la force de séparation du courant d'air. A ce point l'ouverture de la glotte est maximale. L'énergie cinétique qui a été accumulée comme tension élastique dans les cordes vocales commence à rétrécir cette ouverture et de plus la force de Bernoulli accélère encore la fermeture abrupte de la glotte [3]. Ce processus périodique est caractérisé par une fréquence propre à chaque personne, connue sous le nom de fréquence fondamentale (Fo) où pitch et il donne la hauteur normale de la voix. La fréquence fondamentale peut varier de 80 à 200 Hz pour une voix masculine, de 150 à 450 Hz pour une voix féminine et de 200 à 600 Hz pour une voix d'enfant [4]. Cette fréquence fondamentale peut varier suite à des facteurs liés au stress, intonation et émotions. Le timbre de la voix est déterminé par les amplitudes relatives des harmoniques du fondamental. L'intensité du son émis est liée à la pression de l'air en amont de larynx. Tous ces aspects pour un son voisé peuvent être observés dans la figure I.3. Figure (1.4) : Spectre du Son Voisé / i / 1.2.2.2 Phonation de Sons non Voisés Les sons non voisés sont générés par le passage de l'air dans une uploads/Industriel/ these-22-converti.pdf
Documents similaires










-
27
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Nov 28, 2022
- Catégorie Industry / Industr...
- Langue French
- Taille du fichier 1.4607MB