3. Indices d’autocorrélation spatiale BOUAYAD AGHA SALIMA GAINS (TEPP) et Crest

3. Indices d’autocorrélation spatiale BOUAYAD AGHA SALIMA GAINS (TEPP) et Crest Le Mans Université MARIE-PIERRE DE BELLEFON Insee 3.1 Qu’est-ce que l’autocorrélation spatiale? 54 3.1.1 Observation empirique de l’autocorrélation spatiale . . . . . . . . . . . . . 54 3.1.2 Le diagramme de Moran . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.2 Mesurer la dépendance spatiale globale 56 3.2.1 Indices d’autocorrélation spatiale . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 3.2.2 Autocorrélation spatiale des variables catégorielles . . . . . . . . . . . . . 62 3.3 Mesurer la dépendance spatiale locale 65 3.3.1 Indice de Getis et Ord . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.3.2 Indicateurs d’autocorrélation spatiale locale . . . . . . . . . . . . . . . . . . . 65 3.3.3 Significativité du I de Moran local . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 3.3.4 Interprétation des indices locaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.4 Indices spatio-temporels 70 Résumé Les indices d’autocorrélation spatiale permettent de mesurer la dépendance spatiale entre les valeurs d’une même variable en différents endroits de l’espace. Plus les valeurs des observations sont influencées par les valeurs des observations qui leur sont géographiquement proches, plus l’autocorrélation spatiale est élevée. Ce chapitre définit l’autocorrélation spatiale, puis décrit les indices d’autocorrélation spatiale au niveau global et local : principes, propriétés, mise en œuvre pratique avec R et interprétation de leur significativité. 54 Chapitre 3. Indices d’autocorrélation spatiale R La lecture préalable des chapitres 1 : "Analyse spatiale descriptive" et 2 : "Codifier la structure de voisinage" est recommandée. Très souvent, les variables pour lesquelles on dispose d’informations géolocalisées se caractérisent par des dépendances spatiales qui sont d’autant plus fortes que les localisations sont plus proches. Ainsi, l’accès de plus en plus fréquent à des données spatialisées permet de mieux prendre en compte les interactions et les externalités spatiales dans l’analyse des décisions économiques des agents. Une analyse des structures spatiales comprises dans les données est indispensable pour traiter, si cela s’avère nécessaire, la violation de l’hypothèse d’indépendance spatiale des variables. D’autre part, en termes d’interprétation, l’analyse de l’autocorrélation spatiale permet une analyse quantifiée de la structure spatiale du phénomène considéré. Les indices d’autocorrélation spatiale permettent de mesurer la dépendance spatiale entre les valeurs d’une même variable en différents endroits de l’espace. 3.1 Qu’est-ce que l’autocorrélation spatiale? L’autocorrélation mesure la corrélation d’une variable avec elle-même, lorsque les observations sont considérées avec un décalage dans le temps (autocorrélation temporelle) ou dans l’espace (autocorrélation spatiale). On définit l’autocorrélation spatiale comme la corrélation, positive ou négative, d’une variable avec elle-même du fait de la localisation spatiale des observations. Cette autocorrélation spatiale peut, d’une part, être le résultat de processus inobservés ou difficilement quantifiables qui associent des localisations différentes et qui, de ce fait, se traduisent par une structuration spatiale des activités : des phénomènes d’interaction (entre les décisions des agents par exemple) ou de diffusion (comme les phénomènes de diffusion technologique) dans l’espace sont autant de phénomènes qui peuvent produire de l’autocorrélaton spatiale. D’autre part, dans le contexte de la spécification de modèles économétriques, la mesure de l’autocorrélation spatiale peut être envisagée comme un outil de diagnostic et de détection d’une mauvaise spécification (variables omises spatialement corrélées, erreurs sur le choix de l’échelle à laquelle le phénomène spatial est analysé, etc.) D’un point de vue statistique, de nombreuses analyses (analyse des corrélations, régressions linéaires, etc.) reposent sur l’hypothèse d’indépendance des variables. Lorsqu’une variable est spatialement autocorrélée, l’hypothèse d’indépendance n’est plus respectée, remettant ainsi en cause la validité des hypothèses sur la base desquelles ces analyses sont menées. D’autre part, l’analyse de l’autocorrélation spatiale permet une analyse quantifiée de la structure spatiale du phénomène étudié. On insistera sur le fait que structure spatiale et autocorrélation spatiale ne peuvent pas exister indépendamment l’une de l’autre (TIEFELSDORF 1998) : — on désigne par structure spatiale l’ensemble des liens grâce auxquels le phénomène autocor- rélé va se diffuser; — sans la présence d’un processus autocorrélé significatif, la structure spatiale ne peut être empiriquement observée. La distribution spatiale observée est alors considérée comme la manifestation du processus spatial sous-jacent. 3.1.1 Observation empirique de l’autocorrélation spatiale En présence d’autocorrélation spatiale, on observe que la valeur d’une variable pour une observation est liée aux valeurs de cette même variable pour les observations voisines. — L’autocorrélation spatiale est positive lorsque des valeurs similaires de la variable à étudier se regroupent géographiquement. 3.1 Qu’est-ce que l’autocorrélation spatiale? 55 — L’autocorrélation spatiale est négative lorsque des valeurs dissemblables de la variable à étudier se regroupent géographiquement : des lieux proches sont plus différents que des lieux éloignés. On retrouve généralement ce type de situation en présence de concurrence spatiale. — En l’absence d’autocorrélation spatiale, on peut considérer que la répartition spatiale des observations est aléatoire. Les indices d’autocorrélation spatiale permettent d’évaluer la dépendance spatiale entre les valeurs d’une même variable en différents endroits de l’espace et de tester la significativité de la structure spatiale identifiée. Pour la mettre en évidence, les indices prennent en compte deux critères : — la proximité spatiale; — la ressemblance ou la dissemblance des valeurs de la variable pour les unités spatiales considérées. Attention : si les données sont agrégées suivant un découpage qui ne respecte pas le phénomène sous-jacent, on surestimera ou sous-estimera la force du lien spatial. On distingue la mesure de l’autocorrélation spatiale globale d’une variable dans un espace donné et celle de l’autocorrélation locale dans chaque unité de cet espace. Celle-ci mesure l’intensité et la significativité de la dépendance locale entre la valeur d’une variable dans une unité spatiale et les valeurs de cette même variable dans les unités spatiales voisines (plus ou moins proches, selon le critère de voisinage retenu). 3.1.2 Le diagramme de Moran Le diagramme de Moran permet une lecture rapide de la structure spatiale. Il s’agit d’un nuage de points avec les valeurs de la variable y centrée en abscisse et les valeurs moyennes de la variable pour les observations voisines Wy en ordonnée (où W est la matrice de poids normalisée). Les deux propriétés y centrée et W normalisée impliquent que la moyenne empirique de Wy est égale à celle de y et donc à 0. On trace également la droite de régression linéaire de Wy en fonction de y et les droites d’équation y = 0 et Wy = 0 qui délimitent des quadrants. Si les observations sont réparties aléatoirement dans l’espace, il n’y a pas de relation particulière entre y et Wy. La pente de la droite de régression linéaire est nulle, et les observations sont réparties uniformément dans chacun des quadrants. Si au contraire les observations présentent une structure spatiale particulière, la pente de la régression linéaire est non nulle puisqu’il existe une corrélation entre y et Wy. Chacun des quadrants définis par y = 0 et Wy = 0 correspond à un type d’association spatiale particulier (figures 3.1 et 3.2). — Les observations situées en haut à droite (quadrant 1) présentent des valeurs de la variable plus élevées que la moyenne, dans un voisinage qui leur ressemble (autocorrélation spatiale positive et valeur de l’indice élevé; structure high-high). — En bas à gauche (quadrant 3), les observations présentent des valeurs de la variable plus faibles que la moyenne, dans un voisinage qui leur ressemble (autocorrélation spatiale positive et valeur de l’indice faible; structure low-low). — Les observations situées en bas à droite (quadrant 2) ont des valeurs de la variable plus élevées que la moyenne dans un voisinage qui ne leur ressemble pas (autocorrélation spatiale négative et valeur de l’indice élevé; structure high-low). — En haut à gauche (quadrant 4), les observations présentent des valeurs de la variable plus basses que la moyenne dans un voisinage qui ne leur ressemble pas (autocorrélation spatiale négative et valeur de l’indice faible; structure low-high). 56 Chapitre 3. Indices d’autocorrélation spatiale La densité de points dans chacun des quadrants permet de visualiser la structure spatiale dominante. Le diagramme de Moran permet aussi de visualiser les points atypiques qui s’éloignent de cette structure spatiale. FIGURE 3.1 – Illustration, sur les Iris parisiens, de l’écart entre une distribution aléatoire et une distribution autocorrélée spatialement Source : Insee, Revenus Fiscaux Localisés 2010 FIGURE 3.2 – Diagramme de Moran uploads/Ingenierie_Lourd/ imet131-g-chapitre-3.pdf

  • 30
  • 0
  • 0
Afficher les détails des licences
Licence et utilisation
Gratuit pour un usage personnel Attribution requise
Partager