Configurations urbaines et ségrégation sociale par le prisme de la modélisation

Par Omar Rifki, chercheur post-doctoral à l’École urbaine de Lyon

Omar Rifki
Anthropocene 2050
15 min readApr 23, 2020

--

voir légende infra

Actuellement aux États-Unis, le Covid-19 affecte davantage les minorités raciales, surtout les Afro-Américains. Par exemple en Louisiane, 70 % des morts de la maladie sont issus de cette minorité alors qu’ils ne représentent que 30 % de la population de la ville (Bouie 2020). Cette situation catastrophique est expliquée par la vulnérabilité économique dont souffre cette communauté, pour laquelle les emplois sont souvent dans le secteur des services, ce qui requiert un contact avec un grand nombre de personnes et donc une plus grande chance d’être contaminé (Bouie 2020). Une autre raison est liée à ségrégation résidentielle aux États unis qui, en lien avec le premier facteur, a tendance à créer des clusters de contamination. Un tour d’horizon dans la répartition des quartiers des grandes villes américaines, comme le montre Figure 1, suggère une nette division de l’espace urbain selon l’origine raciale ou ethnique. Cette ségrégation ne concerne pas que les États-Unis. Nous connaissons tous une ou deux chinatowns des métropoles mondiales, que cela soit le 13e arrondissement de Paris, ou Yokohama au sud de Tokyo. Cela s’applique également par exemple au quartier indien aux alentours de la Gare du Nord à Paris et éventuellement aux innombrables banlieues des villes européennes dont la population est souvent d’origine immigrée.

Quelles raisons poussent les personnes de la même classe / groupe / origine ethnique à se regrouper ensemble géographiquement ? Ceci est une question à laquelle Thomas Schelling, économiste états-unien et prix Nobel d’économie en 2005 pour ses contributions fondamentales en théorie des jeux, a essayé de répondre avec un modèle simple et astucieux, puisqu’il met en évidence la force subtile derrière ces configurations urbaines de ségrégation. J’ai eu le plaisir de découvrir ce modèle dans l’excellent manuel d’économie de David Easley et Jon Kleinberg « Networks, Crowds, and Markets ». Je précise à ce titre que mes recherches principales portent sur les applications de routage dans le domaine du transport. Ce post est le deuxième d’une série à visée pédagogique sur la modélisation spatiale. Dans ce qui suit, nous allons dans un premier lieu décrire le modèle de Schelling, le simuler, pour ensuite pour ceux qui veulent aller plus loin combiner ce modèle avec une structure de réseau social plus réaliste que celle du modèle de base, à savoir les réseaux dits « petit-monde ». Le code que j’ai implémenté pour les simulations est donné en fin du post dans le langage de programmation Python, à l’intention des personnes qui voudraient reproduire les résultats par eux-mêmes.

Figure 1. Composition de la population des villes de Dallas (haut à droite), San Francisco (haut à gauche) et Washington (bas) selon l’origine ethnique. Source : http://racialdotmap.demographics.coopercenter.org/

Modèle de Schelling

Le modèle se décrit comme suit. Les individus de la population sont divisés en un nombre de types, qui peuvent représenter soit l’ethnie, la religion, l’origine, la caste (au cas où nous nous plaçons dans le sous-continent indien) ou tout autre descriptif ou une combinaison des éléments précédents. Dans la modélisation nous allons considérer uniquement deux types : les jaunes et les verts . Ces individus vivent dans une grille comme le montre la Figure 2, où chacun d’eux est connecté à 4 voisins au plus (les extrémités sont liées à 2 ou à 3 voisins). Chaque sommet s’il est occupé représente alors un individu, sinon c’est un emplacement vide. La grille tout entière représente la configuration spatiale, qui est évidemment une simplification extrême de l’aire urbaine à modéliser. Ceci nous permettra néanmoins de nous focaliser sur les dynamiques d’interaction entre individus. Le paramètre essentiel du modèle est la préférence, qui est un pourcentage. Le modèle est tel que chaque individu a une préférence sur la composition éthique de son voisinage, disant qu’il est satisfait si au moins un tiers de son voisinage est du même type que le sien. Le paramètre préférence est égale alors à 1/3 dans cet exemple. La satisfaction de chaque individu (sommet) est fonction de ce paramètre.

La règle qui gouverne le modèle de Schelling est assez simple : Les individus qui sont satisfaits restent dans leurs emplacements, ceux qui ne le sont pas changent d’emplacement avec un nœud quelconque inoccupé du réseau (violet).

Figure 2. À droite une configuration initiale de la grille où vivent les sommets de type jaune, vert, en plus d’un seul sommet inoccupé en violet. À gauche, les sommets insatisfaits entourés en rouge pour cette configuration initiale pour une préférence égale à un tiers. Par exemple le sommet vert en haut entouré en rouge a trois voisins jaune et aucun vert, il est insatisfait. De même pour le sommet jaune entouré en rouge qui a un seul voisin jaune parmi ses 4 voisins. Son niveau de satisfaction est donc 1/4, alors que le seuil de satisfaction (la préférence) est 1/3.

Une préférence égale à tiers de son voisinage est en effet une contrainte assez faible. Cela infère que les personnes acceptent de vivre en minorité dans leur entourage, bien qu’ils préfèrent ne pas être dans une extrême minorité (moins de 1/3). Schelling (1969) a démontré que ce petit biais en termes de préférence dans la configuration locale a un impact énorme dans la convergence globale du système, qui mène constamment à un monde de ségrégation spatiale, comme nous allons le voir. Ceci est à première vue un résultat contre-intuitif si nous nous restreignons à l’échelle locale, mais qui s’avère être robuste. Plusieurs variations et extensions du modèle ont en effet confirmé l’existence de ce résultat de groupement.

Dans les années 70, Schelling avait utilisé des pièces de monnaie sur une grille dessinée pour simuler ce modèle. Dans l’air du temps, ce modèle sera simulé avec un programme informatique. Notons que ce type de programme qui émule des interactions entre des individus est nommé « modèle basé sur des agents » ou bien « Agent-Based model (ABM) » en anglais. La première étape du programme de simulation est de placer les nœuds dans la grille suivant leurs types, ce qui peut être réalisé d’une manière aléatoire en spécifiant en entrée les probabilités initiales pour chaque type de nœud. Notre monde sera composé de 35 % de jaune, 35% de vert et 10 % de sommets inoccupés. On applique ensuite la règle principale du modèle de Schilling itérativement.

Ci-dessous le déroulement de la simulation pour une grille composée de 50 x 50 individus. À partir d’une même configuration initiale, l’algorithme est exécuté pour trois valeurs croissantes de préférence : 30 %, 50 % et 70 %. Les configurations finales montrent une ségrégation grandissante de l’aire urbaine en corrélation avec la préférence en entrée, de telle manière qu’avec une préférence égale à 70 %, on a quasiment un monde gouverné par deux blocs qui font face. Le résultat suivant une préférence égale à 30 % dessine déjà un monde assez séparé. Nous pouvons naviguer facilement le long de la grille en restant uniquement parmi les membres d’une même communauté.

Figure 3. La configuration initiale de la grille (haut à gauche), et les configurations finales résultantes données pour une préférence égale à 30% (haut à droite), 50% (bas à gauche) et 70% (bas à droite).

Une des raisons derrière ce comportement paradoxal revient à l’effet de cascade et des externalités (Jackson 2019). En effet lorsqu’un individu change d’emplacement, il impacte les membres de son ancien ainsi que de son nouveau voisinage. Certains de ses anciens voisins qu’il a laissés derrière peuvent devenir insatisfaits, puisque son départ impacte le calcul de leurs propre ratio de satisfaction. La décision des individus de se déplacer a donc plusieurs répercussions, pas que sur leur satisfaction individuelle, mais surtout sur la satisfaction des voisins, donc sur la décision de ces derniers de se déplacer à leur tour, et ainsi de suite. L’effet de cascade est alors déclenché. Une ville exhibant une grande ségrégation géographique n’est ainsi pas automatiquement le fruit de l’intolérance de ses habitants nous informe Schelling par son modèle. Donc ceci est une idée à laquelle il faut tordre le cou sans doute.

Pour aller plus loin : Les réseaux petit-monde

Dans cette section, nous altérons la grille, le réseau social de base de notre modèle, par une structure plus parlante, plus réaliste. Le phénomène de petit-monde est lié au fait que la distance séparant les personnes dans un réseau social est généralement assez petite. Par distance, il faudrait comprendre le nombre de personnes intermédiaires. Cette observation connue dans la culture populaire par la maxime selon laquelle il serait possible d’entrer en contact direct avec n’importe quelle personne dans le monde grâce à six intermédiaires consécutifs a trouvé son formalisme dans les fameuses expérimentations du sociologue américain Stanley Miligram (Miligram 1967).

Le concept des six degrés de séparation est entré dans la culture populaire: exemple de film, et de musique.

Plusieurs mathématiciens et informaticiens ont proposé par la suite de formaliser cette famille de modèle de graphes, qui est caractérisé en plus des distances moyennes petites, par un ratio de clustering élevé, ce qui implique l’existence de clusters de nœuds (un groupement de nœuds connectés) biens établies dans le réseau. Un des plus fameux modèles proposés à ce sujet est celui de Watts et Strogatz (Watts et Strogatz 1998) dans lequel les nœuds sont placés sur un cercle, de telle manière que chaque nœud est connecté à ses proches voisins (d’où un clustering géographique élevé), avec l’ajout en surplus d’un nombre d’arcs à longue portée qui sont affectés aléatoirement. La figure 4 fournit une image de ce type de graphe.

Jon Kleinberg a étendu ce dernier modèle de Watts et Strogatz de sorte que le graphe de base soit une grille. Son modèle a trois paramètres (p, q, r), avec p est égale pour un nœud u à la distance maximale des voisins avec qui il établit des connexions (si p=1, on se connecte uniquement aux voisins directs), q est le nombre d’arcs à longue portée pour chaque nœud, et r est un paramètre lié à la distribution de ces arcs à longue portée. Une grille basique comme celle étudiée dans la première section est complètement décrite par p = 1 et q = 0. L’exemple à droite de la Figure 4 est donné pour p = 1 et q = 2 (le nœud u a uniquement deux arcs à longue porté, vers v et w). Concernant le paramètre r, s’il est grand, les arcs à longue portée auront une plus grande probabilité de pointer vers des nœuds proches du nœud source u. Un r = 0 correspond à une répartition aléatoire de ces ars comme pour le cas du modèle de Watts et Strogatz. Nous fixons p = 1 et q = 2 dans la suite du post, et faisant varier le paramètre r, qui sera la variable principale de notre modèle de petit-monde.

Figure 4. À gauche une représentation du modèle du petit-monde de Watts -Strogatz, prise de Watts et Strogatz (1998), et à droite une représentation de son extension en prenant la grille comme graphe de base, prise de Kleinberg (2000).

Tout d’abord, voyons l’équivalent de la Figure 3 pour un réseau de petit-monde avec r = 2. En comparant visuellement Figure 3 et 5, nous notons les représentations du réseau petit-monde sont légèrement plus groupées que celles du réseau de grille. Ceci est une impression, saisir la différence nécessitera une évaluation plus rigoureuse.

Figure 5. Figure équivalente à la Figure 3 pour un réseau de petit-monde avec un paramètre r = 2.

Pour mesurer la ségrégation d’une configuration spatiale (donc du réseau social sous-jacent), nous utilisons deux mesures qui ont été employées par les implémentations du modèle de Schelling sur internet (les liens sont donnés ci-dessous). La première mesure permet d’évaluer la ségrégation en tant que la moyenne prise sur toute la population du ratio de satisfaction. Pour rappel, ce dernier est tout simplement égal pour chaque individu (ou nœud donné) au nombre des voisins du même type divisé par le nombre total de voisins (en général c’est le ratio sur lequel la satisfaction individuelle est établie pour appliquer la règle de Schilling). Le deuxième paramètre est le nombre de communautés dans le réseau. Par communauté nous désignons un ensemble de nœuds qui sont de même type tel qu’il existe un chemin entre chaque deux éléments de ce groupe, avec la contrainte suivante : ce chemin doit passer uniquement par les nœuds de la communauté. En d’autres termes, une communauté, c’est un îlot d’individus qui sont voisins et de même type.

Figure 6. L’évolution des deux mesures de ségrégation en fonction du ratio de préférence des individus du réseau.

Les deux tracés de la Figure 6 confirment les résultats obtenus dans les implémentations sur internet pour le cas de grille, à savoir que la satisfaction moyenne (sortie de la configuration finale) est croissante par rapport au ratio de préférence (entrée de la configuration initiale), et très largement élevé par rapport à ce dernier ratio. Pour une préférence de 10%, nous atteignons une satisfaction globale aux alentours de 50%. Pour bien saisir la correspondance entre ces deux variables, il faut garder à l’esprit que la préférence est un paramètre local des nœuds, des individus, alors que la moyenne de satisfaction traduit l’état macro du réseau, la résultante de la simulation.

La figure de satisfaction globale nous informe également que la grille constitue une borne supérieure par rapport aux réseaux de petit-monde, bien que les courbes sont proches entres elles. La grille est d’une certaine manière une configuration optimiste. Les réseaux de petit-monde nuance ce fait et nous informe que les réseaux sont en réalité moins segmentée qu’ils ont en l’air et les agents sont moins satisfaits, en notant au passage qu’un réseau petit-monde avec r = 4 a des arcs à longue portée plutôt localisé dans le voisinage proche.

Le résultat que nous venons de décrire est d’une certaine manière paradoxal avec celui du tracé du nombre de communautés. En effet, comme les réseaux petit-monde sont supposés être moins segmentés (figure à de satisfaction globale), le nombre de communautés est supposé être de ce fait plus élevé, mais nous obtenons l’inverse, un nombre de communautés exceptionnellement bas. Ce dernier pourrait s’expliquer par l’existence des arcs à longue portée qui réduisent les barrages entre les communautés. Les deux mesures utilisées sont sans doute insuffisantes, d’après ce que nous constatons. Nous sommes ramenés pour la suite de l’analyse à la question fondamentale : comment est-il possible de mesurer la ségrégation sur un réseau social ?

Enseignements

Dans ce post nous avons examiné le modèle de Schelling. Ce modèle assez simple permet d’expliquer le phénomène de ségrégation en contexte urbain. Il nous informe surtout que bien que les individus du réseau ont une vision tolérante, l’émergence collective de ségrégation apparaît assurément. L’usage des réseaux petit-monde nuance ce propos, et pose la question de mesure de la ségrégation urbaine pour un réseau social.

Pour les programmeurs : Code

Pour celles et ceux qui aimeraient reproduire les simulations du post, le code ci-dessous en Python 3 est donné. Nous nous sommes basé pour l’implémentation sur la librairie Networkx pour générer la structure de graphe. Le paradigme orienté objet du langage Python permet d’avoir une bonne visibilité du code et de faire également usage du concept d’encapsulation. Une seule classe nous a été suffisante pour implémenter l’algorithme de Schelling. Cette classe qu’on a nommée Area encapsule la structure du réseau. Les paramètres préférence et type des sommets du graphe ont été ajoutés en tant qu’attributs à la structure nœud du réseau Networkx, ce qui a entre autres facilité la lisibilité du code et le déroulement de l’algorithme. Ci-dessous la classe Area avec une fonction d’exécution exemple qui permet de reproduire les Figures 3 et 5. La simulation se déroule d’une manière itérative en appliquant la règle principale du modèle de Schilling vu précédemment, jusqu’à atteindre une convergence. Le critère de convergence dans notre contexte est défini par rapport à la satisfaction totale de la population. La simulation s’arrête si pas plus 1 % de la population reste insatisfaite. Un deuxième seuil threshold_convergence est ajouté de telle manière que l’algorithme ne soit pas bloqué dans un minimum local si le seuil principal de l’itération threshold_hapiness n’est encore pas satisfait.

Plusieurs pages web proposent une simulation du modèle de Schelling dans sa configuration initiale (grille). Citons par exemple :

L’écriture de ce post vient à la suite de la lecture d’autres approches sur internet qui ont implémenté le modèle de Schelling, bien que leurs codes soient différents du nôtre, il est important de les citer afin d’apprécier les différentes manières d’implémentation : lien1, lien2, lien3, et lien4.

Références bibliographiques.

Easley, David, and Jon Kleinberg. 2010. Networks and markets (Vol. 8). Cambridge: Cambridge university press :

Ce livre allie théorie des graphes, théorie des jeux et applications économiques. L’avantage du livre est d’être accessible pour les non-spécialistes du domaine et assez pédagogique. Le modèle de Schelling est présenté dans le chapitre 4.

Jamelle Bouie. 14 Avril 2020. Article du « The New York Times » intitulé « Why Coronavirus Is Killing African-Americans More Than Others » disponible sur le Lien.

Schelling, Thomas C. 1969. Models of segregation. The American Economic Review, 59(2), pp.488–493.

Jackson, Matthew O. 2019. The Human Network: How Your Social Position Determines Your Power, Beliefs, and Behaviors. Pantheon.

Milgram, Stanley. 1967. The small world problem. Psychology today, 2(1), pp.60–67.

Watts, Duncan J., and Steven H. Strogatz. 1998. Collective dynamics of ‘small-world’networks. nature, 393(6684), p.440.

Kleinberg, Jon. 2000, May. The small-world phenomenon: An algorithmic perspective. In Proceedings of the thirty-second annual ACM symposium on Theory of computing (pp. 163–170).

--

--