Outils pour la compression des signaux
Applications aux signaux audio
Nicolas Moreau
Lavoisier
Introduction
11
Première partie. Outils pour la compression des signaux
15
Chapitre 1. Quantification scalaire
17
1.1. Introduction17
1.2. Quantification scalaire optimale19
1.2.1. Conditions nécessaires d'optimalité19
1.2.2. Puissance de l'erreur de quantification21
1.2.3. Compléments24
1.2.3.1. Algorithme de Lloyd-Max24
1.2.3.2. Transformation non-linéaire24
1.2.3.3. Facteur d'échelle24
1.3. Quantification scalaire prédictive25
1.3.1. Principe25
1.3.2. Quelques rappels sur la théorie de la prédiction linéaire26
1.3.2.1. Introduction : minimisation au sens des moindres carrés26
1.3.2.2. Approche théorique27
1.3.2.3. Comparaison des deux approches28
1.3.2.4. Filtre blanchissant29
1.3.2.5. Algorithme de Levinson30
1.3.3. Gain de prédiction31
1.3.3.1. Définition31
1.3.4. Valeur asymptotique du gain de prédiction32
1.3.5. Quantification scalaire prédictive en boucle fermée34
Chapitre 2. Quantification vectorielle
37
2.1. Introduction37
2.2. Formalisme37
2.3. Construction du dictionnaire optimal39
2.4. Performances du quantificateur optimal42
2.5. Utilisation du quantificateur44
2.5.1. Quantification vectorielle arborescente45
2.5.2. Quantification vectorielle par produit cartésien45
2.5.3. Quantification vectorielle de type gain-forme45
2.5.4. Quantification vectorielle multi-étages45
2.5.5. Quantification vectorielle par transformée46
2.5.6. Quantification vectorielle algébrique46
2.6. Quantification vectorielle de type gain-forme47
2.6.1. Règle du plus proche voisin47
2.6.2. Algorithme de Lloyd-Max48
Chapitre 3. Codage par transformée, en sous-bandes
51
3.1. Introduction51
3.2. Equivalence entre bancs de filtres et transformées52
3.3. Allocation de bits54
3.3.1. Définition du problème54
3.3.2. Allocation de bits optimale55
3.3.3. Algorithme pratique57
3.3.4. Compléments57
3.4. Transformation optimale60
3.5. Performances62
3.5.1. Gain de transformation62
3.5.2. Résultats de simulation65
Chapitre 4. Codage entropique
67
4.1. Introduction67
4.2. Codage sans bruit d'une source discrète sans mémoire68
4.2.1. Entropie d'une source68
4.2.2. Codage d'une source70
4.2.2.1. Définitions70
4.2.2.2. Code instantané uniquement décodable71
4.2.2.3. Inégalité de Kraft72
4.2.2.4. Code optimal73
4.2.3. Théorème du codage sans bruit d'une source discrète sans mémoire74
4.2.3.1. Proposition 174
4.2.3.2. Proposition 275
4.2.3.3. Proposition 376
4.2.3.4. Théorème76
4.2.4. Construction d'un code76
4.2.4.1. Code de Shannon76
4.2.4.2. Algorithme de Huffman77
4.2.4.3. Premier exemple77
4.2.5. Généralisation78
4.2.5.1. Théorème78
4.2.5.2. Deuxième exemple79
4.2.6. Codage arithmétique80
4.3. Codage sans bruit d'une source discrète avec mémoire81
4.3.1. Nouvelles définitions81
4.3.2. Théorème du codage sans bruit d'une source discrète avec mémoire82
4.3.3. Exemple d'une source markovienne83
4.3.3.1. Généralités83
4.3.3.2. Exemple de la transmission de documents par télécopie84
4.4. Quantificateur scalaire avec contrainte entropique86
4.4.1. Introduction86
4.4.2. Quantificateur de Lloyd-Max88
4.4.3. Quantificateur avec contrainte entropique90
4.4.3.1. Expression de l'entropie91
4.4.3.2. Inégalité de Jensen92
4.4.3.3. Quantificateur optimal93
4.4.3.4. Source gaussienne93
4.5. Capacité d'un canal discret sans mémoire94
4.5.1. Introduction94
4.5.2. Information mutuelle95
4.5.3. Théorème de codage pour un canal bruité97
4.5.4. Exemple : canal binaire symétrique97
4.6. Codage d'une source discrète avec un critère de fidélité98
4.6.1. Problème98
4.6.2. Fonction débit-distorsion99
4.6.3. Théorèmes100
4.6.3.1. Théorème du codage de source100
4.6.3.2. Codage combiné source-canal101
4.6.4. Cas particulier : mesure de distorsion quadratique101
4.6.4.1. Borne inférieure de Shannon pour une source sans mémoire101
4.6.4.2. Source avec mémoire102
4.6.5. Généralisation103
Deuxième partie. Applications aux signaux audio
105
Chapitre 5. Introduction aux signaux audio
107
5.1. Caractéristiques des signaux de parole107
5.2. Caractéristiques des signaux de musique108
5.3. Normes et recommandations109
5.3.1. Signal de parole en bande téléphonique109
5.3.1.1. Réseau téléphonique public109
5.3.1.2. Communication avec les mobiles110
5.3.1.3. Autres applications111
5.3.2. Signal de parole en bande élargie111
5.3.3. Signal de musique en bande Hi-Fi111
5.3.3.1. MPEG-1112
5.3.3.2. MPEG-2112
5.3.3.3. MPEG-4113
5.3.3.4. MPEG-7, MPEG-21116
5.3.4. Evaluation de la qualité116
Chapitre 6. Codeurs de signaux de parole
119
6.1. Les codeurs MIC et MICDA119
6.2. Le codeur LPC10 à 2.4 kbit/s120
6.2.1. Détermination des coefficients du filtre120
6.2.2. Cas des sons non voisés121
6.2.3. Cas des sons voisés122
6.2.4. Détermination sons voisés/sons non voisés124
6.2.5. Contrainte de débit125
6.3. Le codeur CELP125
6.3.1. Introduction125
6.3.2. Détermination des coefficients du filtre de synthèse128
6.3.3. Modélisation de l'excitation130
6.3.3.1. Introduction d'un facteur perceptuel130
6.3.3.2. Choix du modèle d'excitation131
6.3.3.3. Dictionnaire filtré132
6.3.3.4. Minimisation au sens des moindres carrés133
6.3.3.5. Algorithme itératif standard135
6.3.3.6. Choix du dictionnaire d'excitation136
6.3.3.7. Introduction d'un dictionnaire adaptatif136
6.3.4. Conclusion139
Chapitre 7. Codeurs de signaux de musique
141
7.1. Principe des codeurs «perceptuels»141
7.2. Codeur MPEG-1 Layer1144
7.2.1. Transformation temps/fréquences145
7.2.2. Modélisation psychoacoustique et allocation de bits146
7.2.3. Quantification146
7.3. Codeur MPEG-2 AAC149
7.4. Codeur Dolby AC-3153
7.5. Modèle psychoacoustique : calcul du seuil de masquage153
7.5.1. Introduction153
7.5.2. L'oreille153
7.5.3. Bandes critiques154
7.5.4. Courbes de masquage156
7.5.5. Seuil de masquage157
Chapitre 8. Codage audio : compléments
159
8.1. Codeurs bas-débits/qualité acceptable159
8.1.1. Premier outil : Spectral Band Replication (SBR)160
8.1.2. Deuxième outil : Parametric stereo (PS)161
8.1.2.1. Un bref historique161
8.1.2.2. Principe du codage audio paramétrique stéréo162
8.1.2.3. Résultats162
8.1.3. Perception de l'espace sonore163
8.2. Codeurs haut-débits/sans perte ou presque sans perte164
8.2.1. Introduction164
8.2.2. Normalisation ISO/IEC MPEG-4166
8.2.2.1. Principe166
8.2.2.2. Quelques détails166
Chapitre 9. Codage stéréo : une présentation synthétique
169
9.1. Hypothèses de base et notations169
9.2. Détermination des indices intercanaux171
9.2.1. Estimation de la puissance et de l'intercovariance171
9.2.2. Evaluation des indices intercanaux172
9.2.3. Conclusion174
9.3. Procédure de downmix174
9.3.1. Développement dans le domaine temporel175
9.3.2. Dans le domaine fréquentiel177
9.4. Au récepteur178
9.4.1. Reconstruction du signal stéréo178
9.4.2. Réglage des puissances180
9.4.3. Alignement de phase180
9.4.4. Informations à transmettre dans le canal181
9.5. Draft International Standard182
Troisième partie. Programmes matlab
183
Chapitre 10. Un codeur de parole
185
10.1. Introduction185
10.2. Script de la fonction appelante185
10.3. Script des fonctions appelées190
Chapitre 11. Un codeur de musique
193
11.1. Introduction193
11.2. Script de la fonction appelante193
11.3. Script des fonctions appelées196
Bibliographie
215