Analyse interactive des données (ACP, AFC) avec Excel 2000
Théorie et pratique
Jean-Pierre Georgin
Presses Universitaires de Rennes
Organigramme
Introduction1
1. Régressions linéaires sur deux variables5
1.1 Les différentes méthodes d'approximation linéaire d'un nuage5
1.1.1 Droite de régression observée de y par rapport à x7
1.1.2 Droite de régression observée de x par rapport à y9
1.1.3 Interprétation intuitive de la covariance empirique entre x et y et du coefficient de corrélation linéaire r(x,y)11
1.1.4 Le calcul à la main des droites de régression13
1.1.5 Le calcul des droites de régression à l'aide du classeur ACP14
1.1.6 La représentation graphique des droites de régression à l'aide du classeur ACP17
1.2 Régression orthogonale ou droite des moindres rectangles19
1.2.1 La recherche de la droite de régression orthogonale19
1.2.2 Le calcul à la main de la droite de régression orthogonale23
1.2.3 Le calcul de la droite de régression orthogonale à l'aide du classeur ACP25
2. Présentation de l'analyse générale: méthode commune à l'ensemble des méthodes d'analyse des données29
2.1 Présentation théorique de l'analyse générale30
2.1.1 La matrice des données30
2.1.2 Généralités31
2.2 L'ajustement du nuage des n observations (les individus) par un sous espace de Rp32
2.2.1 Cas particulier de 2 variables (p = 2)32
2.2.2 Calcul des valeurs propres et des vecteurs propres sur un exemple35
2.2.3 Utilisation du classeur ACP37
2.2.4 Cas général de p variables41
2.3 L'ajustement du nuage des p observations (les variables) par un sous espace de Rn41
2.4 Relations entre les deux sous espaces Rq de Rp et de Rn42
2.5 Coordonnées des points individus et variables dans les deux sous espaces Rq de Rp et de Rn43
2.5.1 Les formules générales43
2.5.2 Calculs à la main sur l'exemple 144
2.5.3 Calculs à l'aide du classeur ACP sur l'exemple 144
2.5.4 Estimation graphique des coordonnées des points individus par la feuille AG_graphes du classeur ACP46
2.5.5 Reconstitution et reconstitution approchée du tableau X de départ47
3. L'analyse en composantes principales ou ACP51
3.1 Généralités51
3.2 Analyse du nuage des n individus dans l'espace Rp des variables53
3.2.1 Généralités53
3.2.2 Calculs sur un exemple d'un tableau d'observation à 2 variables et 10 individus61
3.3 Analyse du nuage des p variables dans l'espace Rn des individus71
3.3.1 Généralités71
3.3.2 Calculs sur l'exemple du tableau d'observations à 2 variables et 10 individus75
3.4 Qualité de la représentation des individus et des variables, contribution relative des individus83
3.4.1 Généralités83
3.4.2 Contribution relative d'un individu à la formation d'un axe84
3.4.3 Qualité de la représentation d'un individu85
3.4.4 Qualité de la représentation d'une variable89
3.4.5 Comment interpréter les individus à l'aide de la connaissance des variables explicatives des axes principaux?93
3.5 Premières simulations à l'aide du classeur ACP96
3.6 Les individus et les variables supplémentaires102
3.6.1 Points individus ou points lignes supplémentaires103
3.6.2 Points variables ou points colonnes supplémentaires103
3.6.3 Application sur la matrice 10x2 de l'exemple 1: un individu et une variable supplémentaires104
3.6.4 Application aux données de l'exemple 2A109
3.6.5 Sélections avancées110
3.7 Le classeur ACP117
3.8 Résumé pour l'interprétation d'une analyse en composantes principales123
3.9 Nouvelles simulations utilisant le classeur ACP125
3.10 Application et interprétation du classeur ACP sur l'exemple 4A132
A - Présentation des données132
B - Le classeur ACP133
C - L'analyse en composantes principales sur le classeur ACP134
3.11 Des exemples supplémentaires144
4. L'analyse factorielle des correspondances ou AFC157
4.1 Généralités158
4.1.1 Le tableau K des effectifs158
4.1.2 Le tableau F des fréquences159
4.1.3 Les tableaux profils-lignes et profils-colonnes160
4.2 Analyse du nuage des n lignes dans l'espace Rp des colonnes et des p colonnes dans l'espace Rn des lignes163
4.2.1 Les Le nuage des n lignes dans l'espace Rp des colonnes163
4.2.2 Le nuage des p colonnes dans l'espace Rn des lignes164
4.2.3 Le choix des distances165
4.3 L'ajustement des deux nuages166
4.3.1 Ajustement du nuage des n lignes dans l'espace Rp des colonnes166
4.3.2 Ajustement du nuage des p colonnes dans l'espace Rn des lignes173
4.3.3 Relations entre les deux espaces Rn et Rp174
4.3.4 Tableau résumé des différentes formules de l'AFC176
4.3.5 Calculs sur les exemples 1 et 2177
A. Exemple 1: la matrice K est 4x2177
a. Calculs à la main177
b. Calculs par le classeur AFC181
B. Exemple 2: la matrice K est 4x3187
a. Calculs à la main188
b. Calculs par le classeur AFC190
4.3.6 Formule de reconstitution du tableau des fréquences191
4.3.7 Le test du X2 sur le tableau des fréquences F191
4.4 Aides à l'interprétation193
4.4.1 Qualités de la représentation193
4.4.2 Contributions relatives195
4.5 Les éléments supplémentaires199
4.5.1 Les lignes et colonnes supplémentaires200
4.5.2 Les coordonnées des points-lignes et points-colonnes supplémentaires201
4.5.3 Les qualités de représentation des points-lignes et points-colonnes supplémentaires201
4.5.4 Calcul des coordonnées et des qualités de représentation d'éléments supplémentaires202
4.5.5 Sélections avancées207
4.6 Le classeur AFC212
4.7 Un résumé pour l'interprétation d'une analyse factorielle des correspondances215
4.8 Simulations sur le classeur AFC217
4.9 Application et interprétation du classeur AFC sur l'exemple 4219
A - Présentation des données219
B - Le classeur AFC219
C - L'analyse factorielle des correspondances sur le classeur AFC220
4.10 Des exemples supplémentaires226
Annexes:
1. Le calcul matriciel avec Excel, le classeur Pedago, dérivation matricielle245
2. Les macro-instructions utilisées dans l'ouvrage251
3. Quel type de données utiliser en ACP et AFC?257
4. Liste des fichiers et utilisation du CD-Rom d'accompagnement259
Bibliographie263
Index265