Remerciez-le!

Remerciez @Admin pour avoir partagé cet document gratuitement, de la manière la plus simple, en partageant sur les réseaux sociaux.

(19) Europâisches Patentamt European Patent Office Office européen des brevets

(19) Europâisches Patentamt European Patent Office Office européen des brevets (12) éen des brevets £ P 0 7 8 2 1 28 A 1 DEMANDE DE BREVET E U R O P E E N (43) Date de publication: (51) |nt CI.6: G10L 9/14 02.07.1997 Bulletin 1997/27 (21) Numero de depot: 96402715.5 (22) Date de depot: 12.12.1996 (84) Etats contractants designes: • Le Guyader, Alain D E GB I T 22300 Lannion (FR) (30) Priorite: 15.12.1995 FR 9514925 (74) Mandataire: Loisel, Bertrand et al Cabinet Plasseraud, (71) Demandeur: FRANCE TELECOM 84, rue d'Amsterdam 7501 5 Paris (FR) 75440 Paris Cedex 09 (FR) (72) Inventeurs: • Quinquis, Catherine 22300 Lannion (FR) 00 C M C M 00 h*- o Û_ LU (54) Procédé d'analyse par prédiction linéaire d'un signal audiofréquence, et procédés de codage et de décodage d'un signal audiofréquence en comportant application (57) Le procédé d'analyse par prédiction linéaire est utilisé pour déterminer des paramètres spectraux repré- sentatifs de l'enveloppe spectrale du signal audiofré- quence. Ce procédé comprend q étages de prédiction successifs (5p), q étant un entiersupérieurà 1 . Achaque étage de prédiction p (1<p<q), on détermine des para- mètres représentant un nombre prédéfini M p de coeffi- cients a7P,..., a M p P de prédiction linéaire d'un signal d'entrée dudit étage. Le signal audiofréquence à analy- ser constitue le signal d'entrée du premier étage. Le si- gnal d'entrée (sP(n)) d'un étage p+1 est constitué par le signal d'entrée ( s p _ 1 (n)) de l'étage p filtré par un filtre de fonction de transfert FIG. 1 s°(n) P R E D I C T I O N L I N E A I R E D ' O R D R E Ml C A L C U L D E a -1-5, Mp P ~2 i = l Utilisation notamment dans des codeurs audio en ban- de élargie. s^n) - s°(n) + aj s°(n-l)+ -Ha^ s° (n-Ml) — — — T — ■ I'1 i 6 1 J sp_1 (n) P R E D I C T I O N L I N E A I R E D ' O R D R E M p C A L C U L D E a P , ap ' _5P 1 M p sp(n) = sp~l (n)+apsp_1 (n-l) + .... + appSp-1(n-Mp) ! K P R E D I C T I O N L I N E A I R E D ' O R D R E M q C A L C U L D E aj, , - -5q P r i n t e d b y J o u v e , 7 5 0 0 1 P A R I S ( F R ) EP0 782 128 A1 Description La présente invention concerne un procédé d'analyse par prédiction linéaire d'un signal audiofréquence. Ce pro- cédé trouve une application particulière, mais non exclusive, dans des codeurs audio à prédiction, notamment dans s des codeurs à analyse par synthèse, dont le type le plus répandu est le codeur CELP ("Code-Excited Linear Prédic- tion"). Les techniques de codage prédictif à analyse par synthèse sont actuellement très répandues pour le codage de la parole en bande téléphonique (300-3400 Hz) à des débits pouvant descendre jusqu'à 8 kbit/s, tout en conservant une qualité téléphonique. Pour la bande audio (de l'ordre de 20 kHz), les techniques de codage par transformée sont 1 0 utilisées pour des applications de diffusion et de stockage de signaux vocaux et musicaux. Cependant, ces techniques impliquent des retards de codage relativement importants (plus grands que 100 ms), ce qui produit en particulier des difficultés de participation dans les communications de groupe où l'interactivité est très importante. Les techniques prédictives produisent un retard plus faible, dépendant essentiellement de la longueur des trames d'analyse par pré- diction linéaire (typiquement 10 à 20 ms), et trouvent pour cette raison des applications même pour le codage de 1 5 signaux vocaux et/ou musicaux ayant une largeur de bande supérieure à la bande téléphonique. Les codeurs prédictifs utilisés pour la compression de débit réalisent une modélisation de l'enveloppe spectrale du signal, cette modélisation résulte d'une analyse par prédiction linéaire d'ordre M (IVN10 typiquement en bande étroite), consistant à déterminer M coefficients a; de prédiction linéaire du signal d'entrée. Ces coefficients caractérisent un filtre de synthèse utilisé au décodeur, dont la fonction de transfert est de la forme 1/A(z) avec 20 M A { z ) = l ^ a i z ' 1 ( 1 ) i = l 25 L'analyse par prédiction linéaire a un domaine d'application général plus large que celui du codage de la parole. Dans certaines applications, l'ordre M de la prédiction constitue l'une des variables que l'analyse par prédiction linéaire vise à obtenir, cette variable étant influencée par le nombre de pics présents dans le spectre du signal analysé (voir 3 0 US-A-5 142 581). Le filtre calculé par l'analyse par prédiction linéaire peut avoir diverses structures, conduisant à différents choix de paramètres pour la représentation des coefficients (les coefficients a; eux-mêmes, les paramètres LAR, LSF, LSP, les coefficients de réflexion ou PARCOR...). Avant l'avènement des processeurs de signal numérique (DSP), i l était courant d'employer des structures récursives pour le filtre calculé, par exemple des structures faisant appel aux coef- 3 5 ficients PARCOR du type décrit dans l'article de F . ITAKURA et S. SAITO "Digital Filtering Techniques for Speech Analysis and Synthesis", Proc. of the 7th International Congress on Acoustics, Budapest 1971, pages 261-264 (voir FR-A-2 284 946 ou US-A-3 975 587). Dans les codeurs à analyse par synthèse, les coefficients a; servent également à construire un filtre de pondération perceptuelle utilisé par le codeur pour déterminer le signal d'excitation à appliquer au filtre de synthèse à court terme 4 0 pour obtenir un signal synthétique représentatif du signal de parole. Cette pondération perceptuelle accentue les por- tions du spectre où les erreurs de codage sont les plus perceptibles, c'est-à-dire les zones interformantiques. La fonc- tion de transfert W(z) du filtre de pondération perceptuelle est habituellement de la forme 45 W { z ) = M ï è (2) où y 1 et y 2 sont deux coefficients d'expansion spectrale tels que 0<y2^Yi^1 ■ Une amélioration du masquage du bruit a été apportée par E. Ordentlich et Y . Shoham, dans leur article "Low-Delay Code-Excited Linear Prédictive Coding of 5 0 Wideband Speech at 32 kbps", Proc. ICASSP, Toronto, Mai 1991, pages 9-12. Cette amélioration consiste à combiner pour la pondération perceptuelle le filtre W(z) avec un autre filtre modélisant la pente du spectre. Cette amélioration est particulièrement appréciable dans le cas de codage de signaux à forte dynamique spectrale (bande élargie ou bande audio) pour lesquels les auteurs ont montré une importante amélioration de la qualité subjective du signal reconstruit. 5 5 Dans la plupart des décodeurs CELP actuels, les coefficients de prédiction linéaire a; sont également utilisés pour définir un post-filtre servant à atténuer les zones fréquentielles entre les formants et les harmoniques du signal de parole, sans modifier la pente du spectre du signal. Une forme habituelle de la fonction de transfert de ce post-filtre est : 2 EP0 782 128 A1 HpJz) = G, >/\(z/p2) (1-u^z1) (3) où GP est un facteur de gain compensant l'atténuation des filtres, P - , et p2 sont des coefficients tels que 0<P-,<p2<1 , u. est une constante positive et r - , désigne le premier coefficient de réflexion dépendant des coefficients a;. La modélisation de l'enveloppe spectrale du signal par les coefficients a; constitue donc un élément essentiel du processus de codage et de décodage, en ce sens qu'elle doit représenter le contenu spectral du signal à reconstituer au décodeur et qu'elle pilote aussi bien le masquage du bruit de quantification que le post-filtrage au décodeur. Pour des signaux à forte dynamique spectrale, l'analyse par prédiction linéaire habituellement pratiquée ne parvient pas à modéliserfidèlement l'enveloppe du spectre. Souvent, les signaux de parole sont sensiblement plus énergétiques aux basses fréquences qu'aux fréquences élevées, de sorte que l'analyse par prédiction linéaire conduit certes à une modélisation précise aux basses fréquences, mais au détriment de la modélisation du spectre aux fréquences plus élevées. Cet inconvénient devient particulièrement gênant dans le cas du codage en bande élargie. U n but de la présente invention est d'améliorer la modélisation du spectre d'un signal audiofréquence dans un système faisant appel à un procédé d'analyse par prédiction linéaire. U n autre but est de rendre les performances d'un tel système plus homogènes pour des signaux d'entrée différents (parole, musique, sinusoïdes, signaux DTMF...), des largeurs de bande différentes (bande téléphonique, bande élargie, bande hifi...), des conditions différentes d'enregis- trement (microphone directif, antenne acoustique...) et de filtrage. L'invention propose ainsi un procédé d'analyse par prédiction linéaire d'un signal audiofréquence, pour déterminer des paramètres spectraux dépendant d'un spectre à court terme du signal audiofréquence, comprenant q étages de prédiction successifs, q étant un entier supérieur à 1. A chaque étage de prédiction p (1<p<q), uploads/Management/ ep0782128a1.pdf