Digital Society Forum Digital Society Forum
Entretien 18/05/2019

Les statistiques mondiales ne reflètent pas justement la condition féminine

Enquêteur récoltant des données auprès d'une agricultrice au Ghana, International Institute of Tropical Agriculture, via Flickr , CC BY-NC 2.0
Comment faire pour que l’entrée dans l’ère des données massives ne s’accompagne pas d’un creusement des inégalités ?
Aujourd’hui, dans de nombreux domaines, les femmes sont sous-représentées dans les statistiques nationales et mondiales, celles que récoltent les gouvernements et les agences internationales et qui servent de bases pour l’élaboration de politiques publiques.

Cette sous-représentation peut être quantitative (il y a moins de données sur les femmes) ou qualitative (les problèmes affectant les femmes, comme la santé maternelle, le travail gratuit… sont moins pris en compte dans les enquêtes). La « justice statistique » est pourtant essentielle dans la mise en place de politiques permettant une réelle égalité de genre.
L’organisation Data2X se consacre à promouvoir l’égalité de genre dans les statistiques. Elle travaille avec des agences internationales comme l’ONU, la Banque Mondiale ou encore l’Organisation Mondiale du Travail, ainsi qu’avec des chercheurs et des acteurs de la société civile, pour favoriser la prise en compte de la dimension du genre dans la collecte de données, et développer la prise de conscience autour de ces enjeux-là.
Entretien avec Rebecca Furst-Nichols, directrice adjointe de Data 2x et Eleanor Carey, Responsable technique.

Sur votre site, vous parlez de « bonnes données » et de « mauvaises données ». Qu’est-ce qu’une mauvaise donnée ?
Rebecca Furst-Nichols : A Data2X, nous abordons la question du point de vue du genre : pour nous, de «mauvaises données» sont des données qui ne représentent pas la vie des femmes et des filles de façon juste. Cela peut prendre différents aspects : les données peuvent être inexistantes ou bien avoir été collectées de façon qui reflètent les biais existants dans la société.
Les données économiques sont un exemple frappant. Vous pourrez avoir une étude qui collecte des données sur l’emploi des hommes et des femmes, pour tirer des conclusions sur l’activité des femmes dans le monde. Mais si vous posez d’autres questions ou que vous les formulez différemment, vous allez avoir des informations sur d’autres types d’activités assumées par les femmes— invisibles dans l’étude initiale.

Qu’est-ce que les "gender data", les données relatives au genre ?
Eleanor Carey : Nous nous basons sur la définition de l’ONU des statistiques spécifiques au genre, établies par la commission statistiques. Les données ventilées par sexe permettent d’avoir des données pour les femmes et les hommes. Prenons l’exemple des statistiques sur la part active de la population. Celle-ci peut représenter 50% de la population générale, mais si vous ventilez les données par sexe, vous allez vous apercevoir que la proportion est différente selon les hommes et les femmes : elle est en général plus élevée chez les hommes.
Un autre aspect des données relatives au genre, c’est de s’assurer qu’on pose les bonnes questions, pour ne pas ignorer les expériences des femmes et des filles qui échappent aux collectes de données traditionnelles. Le travail gratuit est un bon exemple. Des données ont été récoltées sur le sujet mais pas de façon systématique. On sait pourtant que le travail gratuit concerne particulièrement les filles et les femmes, et plus encore dans les pays en voie de développement.

Comment peuvent survenir ces biais dans la collecte par exemple ?
Eleanor Carey : Ca dépend des sources utilisées pour récolter les données. Si elles sont récoltées au moyen d’un questionnaire, vous allez commencer par définir ce sur quoi porte le questionnaire et ses questions, et cela peut affecter les informations que vous allez recueillir.
Le sexe des enquêteurs peut aussi impacter la collecte, en particulier si les données portent sur la santé maternelle, l’activité sexuelle… Plusieurs études montrent que des enquêtrices obtiennent dans ces cas des données plus juste. Le moment de la journée où est réalisé l’enquête est aussi important : si les données sont collectées à un moment où les femmes sont indisponibles, vous aurez plus de chances que quelqu’un réponde à leur place.
Se pose ensuite la question du traitement et de la publication des données. Le plus souvent, les agences qui ont initié l’enquête publient un rapport avec leurs données : mais elles oublient souvent de les ventiler par sexe. Ce geste simple représente pourtant un pas en avant considérable.
Parfois aussi les données sur le sexe sont disponibles mais elles ne sont pas exploitées par la recherche. Il est essentiel d’avoir des chercheurs conscients des enjeux de genre, capables de poser les bonnes questions et d’y apporter des réponses prenant en compte l’importance du genre.

Quels domaines de la vie des filles et des femmes restent méconnus à cause de l’absence de données ?

Rebecca Furst-Nichols : En 2014, nous avons étudié les « écart de données » dans 5 grands domaines : l’éducation, la santé, les débouchés économiques, la sécurité des personnes et la participation politiques. Dans chacun de ces champs, nous savions significativement moins de choses sur les vies des femmes et des filles, soit parce que les données étaient de mauvaise qualité, soit parce qu’elles n’existaient pas. C’est particulièrement le cas dans le champ des débouchés économiques : on manque d’informations sur les heures de travail rémunéré ou non, les tâches qu’elles font, l’échelle des rémunérations, la nature et la valeur de ce qu’elles possèdent…
En 2018, nous avons également produit un rapport sur les écarts statistiques dans 15 pays d’Afrique subsaharienne. Les données de genre étaient relativement complètes en matière de santé et d’éducation, mais nous manquons d’informations sur la façon dont les problèmes environnementaux affectent différemment les femmes et les hommes, les filles et les garçons.

Pourquoi avons-nous moins de données sur les filles et les femmes, et les questions qui les affectent en particulier ?
Eleanor Carey : Cela tient à la valeur qui est affectée à une donnée, qui dépend de facteurs sociaux. Quand vous lancez une enquête statistique, vous devez d’abord définir ce sur quoi vous allez récolter des données et quelles données vont être pertinentes. On sait, par exemple, que les données économiques, sur les prix des denrées, l’emploi… tout ce qui sert aux comptes publics et au calcul du PIB, est considéré comme une priorité en termes de collection de données. Alors que nous nous battons pour que des questions comme la santé maternelle, le travail gratuit, la violence envers les filles et les femmes soient reconnues.
L’enjeu, c’est de reconnaître les sujets qui affectent les vies des femmes et des filles, pour qu’ils soient ensuite traduits sous forme de données.
Les gens tendent à penser que si un chiffre existe, il reflète une vérité, sur laquelle on pourra s’appuyer pour établir des réflexions ou des politiques publiques. Mais il faut vraiment comprendre qu’un chiffre ne reflète pas nécessairement une vérité non biaisée. A Data2x, nous travaillons beaucoup là-dessus : toute donnée est subjective.

Avez-vous des exemples de la façon dont cette absence de données affecte la vie des femmes et des filles ?
Eleanor Carey : Très souvent, quand des gouvernements veulent s’attaquer à un problème et développer des politiques autour, ils doivent s’appuyer sur des données. Si les filles et les femmes ne sont pas visibles dans les données, celles-ci vont difficilement pouvoir servir au changement social.
Rebecca Furst-Nichols : Nous avons des exemples où l’utilisation de données fait vraiment une différence : par exemple, les études qui portent sur l’utilisation du temps, qui permettent d’estimer le temps passé à des tâches de care non payées. Ces données montrent quelles sont les activités réelles des femmes : éducation des enfants, soins aux parents âgés etc. et elles peuvent entraîner, nous l’avons vu, des changements dans les politiques publiques tournées vers la garde et le soin des enfants. Pour nous, il y a un lien essentiel entre la politique de données et les politiques publiques, et le changement social.

Qu’a changé le Big Data en termes de données de genre ?
Rebecca Furst-Nichols : Pour l’instant, ce n’est pas entièrement clair. Big data nous donne accès à une masse de données et d’informations, qu’il faut pouvoir mettre à profit de façon différente. Nous appelons cela des « fumées d’échappement numériques » (digital exhaust) : les matières produites par nos activités quotidiennes en ligne. Ce ne sont pas des données qui ont été produites de façon délibérée. C’est une immense opportunité, d’autant que le gender data gap est tel que les statistiques officielles ne suffiront jamais à le combler.
Si nous arrivons à savoir quels genres de Big data peuvent être utilisées pour répondre à des questions relatives au genre, alors nous pourrons savoir si nous pouvons les utiliser pour compléter les statistiques officielles ou les remplacer. Nous finançons des travaux de recherche dans cette direction, pour savoir quelles données utiliser, selon quelle méthodologie… Mais ce champ évolue rapidement.
Les données numériques doivent en général être utilisées en combinaison avec d’autres données. Prenons l’exemple de la géolocalisation : en soi ça ne sert pas à grand-chose. Il faut utiliser ces données en lien avec d’autres données, qui elles peuvent être ventilées par sexe.

N’y a-t-il pas le risque que les biais de collecte demeurent mais deviennent invisibles, avec l’automatisation de la collecte liée à Big Data?
Rebecca Furst-Nichols : Vous pouvez déjà obtenir beaucoup d’informations avec les données téléphoniques, par exemple : vous pouvez déjà connaître beaucoup de traits de la population des usagers de ces téléphones. Si vous avez les données d’un opérateur téléphonique, que vous connaissez le genre des usagers (en admettant bien sûr que ces données soient justes), vous pouvez déjà apprendre pas mal de choses sur la mobilité des hommes et des femmes, où ils se rendent, à quoi ressemble leur réseau social en fonction des personnes qu’ils appellent, ou encore d’autres indicateurs qui donnent des éléments sur leur statut socio-économique : les femmes sont plus pauvres, elles ont un réseau social plus restreint et leur mobilité est aussi réduite. Ce sont des informations importantes et utiles, mais elles ne sont valables que pour la population des usagers de tel opérateur téléphonique. Cela ne nous dit rien sur les femmes qui n’ont pas de téléphone, ou qui utilisent un autre opérateur : un opérateur moins cher, par exemple, préféré par les femmes plus pauvres… Il faut manier ces informations avec prudence, et ne pas généraliser les conclusions à toute la population d’un pays. Les données ne reflètent pas la réalité, elles reflètent la réalité des gens qui génèrent les données.

Vous mentionnez l’importance de ne pas oublier la « ground truth », la vérité au ras du sol. Que veut dire cette expression ?
Eleanor Carey : L’idée c’est que Big Data est utile, mais que nous conseillons toujours de vérifier les résultats du modèle obtenu en comparant avec des résultats tirés d’enquêtes traditionnelles, qui reposent sur des méthodes éprouvées.

Recueillir plus de données peut entrer en conflit avec le respect de la vie privée. Comment pensez-vous cette tension ?
Rebecca Furst-Nichols : Le respect de la privée est absolument essentiel, particulièrement pour les femmes et les filles qui sont parfois les plus vulnérables au sein de groupes déjà marginalisés. Dans notre combat pour donner une plus grande visibilité aux vies des femmes et des filles dans les données, nous devons toujours prendre bien soin que les individus ne soient jamais identifiable. Les statistiques ont une longue tradition d’anonymisation et de respect de la vie privée des personnes fournissant des données. Il nous faut trouver comment traduire ces principes dans les systèmes de données à venir. Big data peut fournir des informations très fines (géolocalisées, par exemple, ou plus fréquentes), et c’est très excitant, mais cela doit être modéré par un cadre assurant la protection des données et de la vie privée. Le RGDP européen a ouvert la voie en ce sens, mais ces problèmes sont mondiaux et nous avons besoin d’autres initiatives de ce genre ailleurs dans le monde.



Les commentaires

Pour réagir à cet article, je me connecte Je m’inscris

Soyez le premier à réagir !

S’inscrire et participer

Inscrivez vous sur le Digital Society Forum pour commenter et réagir sur les articles et être informé des événements à venir

DSF