Les Données libres (ou Open Data) représentent des sources d’informations importantes dans de nombreuses thématiques comme l’environnement. Les traitements et la valorisation de ces données offrent la possibilité de proposer des applications diverses pour les acteurs publics et privés. Informer sur des sujets à partir de différentes sources de données est une profession à part entière. Ainsi, nous allons découvrir le métier de data journaliste avec Raphaëlle Aubert de la société éditrice Le Monde. Dans un premier temps, Raphaëlle nous aidera à mieux définir le métier de data journaliste, notamment à travers son parcours professionnel. Ensuite, nous discuterons des outils utilisés et des méthodes de travail. La géomatique et l’intelligence artificielle sont-elles des composantes importantes du data journalisme ? Enfin, certaines applications et résultats d’enquêtes seront discutés.
- Data journaliste : définition
- Comment devenir data journaliste ?
- Data journalisme : Méthodes de travail
- Les outils du data journaliste
- Le data journalisme et la géomatique
- Les applications et les résultats du data journalisme
- Le data journalisme et l’intelligence artificielle
- Data journaliste : quel salaire ?
Data journaliste : définition
FD (Florian DELAHAYE, Geomatick) : Bonjour Raphaëlle, je te remercie de bien vouloir nous accorder du temps pour cet échange sur le métier de data journaliste. Tu travailles depuis 2020 au journal Le Monde. Peux-tu nous aider à définir le métier de data journaliste ? Le data journalisme, c’est quoi ?
RA (Raphaëlle AUBERT, data journaliste au journal Le Monde) : Bonjour Florian ! Le métier de data journaliste n’est pas évident à définir. Il est plutôt récent et il évolue très rapidement, au gré des techniques, technologies et données disponibles. Je dirais que ce qui lie les data journalistes, c’est le fait d’informer à travers la collecte, le traitement et la vérification de données – souvent en volume important. Il existe une grande diversité de spécialisations et de compétences au sein du métier : analyse de données, images satellites, renseignement en sources ouvertes (ou Open source intelligence, OSINT), visualisation, cartographie, développement web, mise en place de serveurs et de bases de données, création d’outils destinés à l’ensemble de la rédaction… Ou un peu tout cela à la fois !
Comment devenir data journaliste ?
FD : Raphaëlle, je suppose qu’il existe plusieurs formations possibles pour devenir data journaliste. Quelle est la formation typique d’un data journaliste ? A titre personnel, quel est ton parcours ?
RA : Là aussi, il est difficile d’indiquer une formation typique pour exercer ce métier. En France, les écoles de journalisme et les profils qui y sont recrutés demeurent plutôt littéraires – même si les programmes s’adaptent peu à peu.
Voici les deux cas de figure les plus courants parmi mes confrères et consœurs :
- un passage par des études de journalisme puis de l’autoformation ou une spécialisation plus tardive en code informatique et en traitement de données
- une formation en école d’ingénieur puis un apprentissage du journalisme en rédaction.
Les parcours atypiques (sans passage par une école de journalisme) sont encore rares et le métier prend du temps à se diversifier.
De mon côté, j’ai eu la chance d’écrire mes premières lignes de SQL et de Javascript en troisième année de licence, au cours d’un échange universitaire en Caroline du Nord, aux Etats-Unis. J’avais choisi cette école parce qu’elle permettait de découvrir des pratiques journalistiques hors du cadre classique « radio – télé – presse écrite », et j’ai adoré ça.
De retour à Sciences Po, j’ai suivi un master de journalisme entrecoupé d’une année de césure à l’école 42, où j’ai appris à coder en C – un langage pas très utile pour le data journalisme ! J’ai surtout retenu la logique de programmation et j’ai ensuite développé mes connaissances en Python et en Javascript pendant mon alternance au Monde, au service des Décodeurs. C’est au cours de cette année d’apprentissage qu’est née ma passion pour la cartographie : en « tâche de fond », mes chefs m’ont donné la mission de développer un générateur de cartes interactives pour la rédaction. Une sorte de petit « Datawrapper » interne pour la carto !
Data journalisme : Méthodes de travail
FD : Tu travailles aujourd’hui au service Les Décodeurs. Quelles sont les méthodes de travail ? Quelle est la part du temps de recherches et de traitements de données lors d’une enquête ?
RA : Ce temps est très variable en fonction du sujet et de la date limite attendue : de quelques jours pour les papiers assez urgents (souvent liés à l’actualité), à plusieurs semaines ou mois pour les plus grosses enquêtes. J’ai souvent plusieurs projets sur le feu, inscrits dans des temporalités différentes. Je passe aussi du temps en R&D pour créer de nouveaux outils – le dernier en date est un service de tuiles vectorielles que nous utilisons pour nos cartographies et nos récits à « scroller », grâce à la technologie open source « Protomaps ».
Du côté des méthodes de travail, j’ai à cœur de fournir l’information la plus vérifiée possible, mais aussi la plus accessible. La technique m’aide beaucoup à trouver et corriger de possibles erreurs, mais il est aussi essentiel de s’entourer de sources humaines compétentes et fiables. J’aime beaucoup travailler avec des scientifiques – c’est par exemple ce que nous avons fait pour notre enquête data sur la contamination des eaux souterraines.
FD : Travailles-tu en équipe en interne ou avec des partenaires ?
RA : Je travaille souvent en équipe, c’est un atout de mon service et du journal. Dans certaines rédactions, il n’y a qu’un seul data journaliste… Aux Décodeurs, nous sommes sept ou huit à coder régulièrement, chacun avec nos marottes. Il nous arrive souvent de collaborer avec d’autres services : vidéo, design, journaliste spécialisé sur une thématique… Hors du Monde, nous travaillons aussi avec des médias internationaux pour les enquêtes transfrontalières. Les partenariats avec des rédactions françaises sont plus rares à ma connaissance.
Les outils du data journaliste
FD : Quels sont les outils et les langages de programmation utilisés ?
RA : Je ne vais pas pouvoir te donner une liste exhaustive car nous utilisons énormément de technos ! Pour tout ce qui est bases de données, analyse et création d’outils internes, nous utilisons principalement Python (django) et SQL. Côté graphiques, nous préférons Javascript et la bibliothèque d3.js. Pour les visualisations les plus ambitieuses et les récits à scroller, nous nous servons du framework Svelte. En cartographie interactive, outre d3.js, j’utilise MapLibre GL JS et Deck GL JS. Et n’oublions pas QGIS, Illustrator et Figma pour l’exploration de données, le design, et la création d’éléments graphiques statiques.
Le data journalisme et la géomatique
FD : Penses-tu que la géomatique est une composante importante du data journalisme ?
RA : J’en suis convaincue. Nous sommes un service généraliste, et la géomatique peut s’immiscer dans quasiment toutes les thématiques que nous couvrons : élections, environnement, météo, climat, mobilités, logement, économie, éducation… Les données cartographiques sont des éléments très puissants, quasi autoritaires une fois qu’ils sont placés sur une carte, et nous devons donc les utiliser et les représenter avec précaution. La formation SIG et QGIS que nous avons suivie avec toi était essentielle pour cela. Nous apprenons aussi à nous servir de données satellitaires.
FD : Tu utilises des logiciels de Systèmes d’Informations Géographiques. Pourrais-tu nous dire la part de données spatialisées sur l’ensemble des jeux de données traitées ?
RA : Je dirais que les jeux de données contenant des données spatialisées représentent bien plus de la moitié des jeux de données que je traite, mais il y a un biais énorme : je suis passionnée par la cartographie, donc mécaniquement, je suis beaucoup plus amenée à analyser et utiliser ces données spatialisées.
Les applications et les résultats du data journalisme
FD : Tu es (co-)autrice de nombreux articles pour le journal Le Monde. As-tu des thématiques de recherches privilégiées ?
RA : Je fais partie d’un service généraliste, mais je m’intéresse surtout aux questions environnementales, climatiques et météorologiques. Le premier sujet que j’ai pitché en arrivant en stage aux Décodeurs était justement à propos de l’installation des sécheresses météorologique, agricole et hydrologique en France. Ces centres d’intérêt se prêtent particulièrement à l’analyse cartographique. J’ai aussi un penchant pour les mobilités, même si j’ai moins l’occasion de les couvrir, le potentiel carto m’attire !
FD : Tu as récemment analysé les données sur la qualité des eaux souterraines en France Métropolitaine. Peux-tu nous décrire ce travail de data journalisme ?
RA : Avec plaisir ! Nous avons enquêté sur les eaux souterraines du continent européen. Le projet a été initié par le média espagnol Datadista et coordonné par Arena for Journalism in Europe. En France, nous avons analysé des millions de mesures issues du portail de données sur les eaux souterraines Ades. Nous avons dressé un état des lieux de la contamination des eaux souterraines en France, pour comprendre quelles substances polluent nos réserves hydrologiques et cartographier l’état chimique des nappes.
En accord avec des scientifiques du CNRS et du BRGM, nous avons dressé une liste de 300 contaminants d’intérêt, que nous avons ensuite répartis en grandes familles d’usages : pesticides, nitrates, industrie, hydrocarbures aromatiques polycycliques (HAP), médicaments, métaux et autres. Sur près de 24 700 stations de contrôle de France, 6 900, soit plus d’un quart (28 %), ont enregistré au moins un dépassement de leurs valeurs seuils entre 2016 et 2023. Nous avons fait cette analyse dans l’outremer également. En Martinique et en Guadeloupe, la chlordécone, utilisée jusqu’au début des années 1990 dans les bananeraies, dépasse encore les seuils trente ans plus tard.
Ce travail n’aurait pas été possible sans l’accompagnement de nombreux hydrogéologues, ni ton aide précieuse pour dompter QGIS !
Je vous laisse découvrir les résultats dans notre récit à scroller. Il est réservé aux abonnés, mais nous avons publié la carte principale et notre méthodologie en accès libre.
Données traitées en open data
FD : J’ai lu que vous aviez mis à disposition vos données traitées en open data, ont-elles été réutilisées ?
RA : Oui, nous avons publié ces données sur data.gouv.fr il y a peu de temps. Nous avons déjà reçu plusieurs mails de chercheurs intéressés par une réutilisation des données, par exemple pour explorer de possibles liens avec les pathologies environnementales.
FD : Les résultats de ces études sont très enrichissants et ils nous invitent à creuser davantage les sujets traités. De manière générale, quels sont les principaux obstacles rencontrés lors de la réalisation d’un article du journal?
RA : Les obstacles peuvent être de toutes natures, mais je dirais que le manque ou la rétention d’information est évidemment notre plus grand obstacle. C’est là tout l’objet de notre travail : rassembler l’information, puis la vérifier et la rendre compréhensible… Cette information peut être orale, écrite dans un document, et, bien évidemment, produite sous forme de données ! Nous sommes de grands utilisateurs de données ouvertes. Et nous essayons aujourd’hui de contribuer aux travaux de cette communauté open data en publiant les jeux de données de nos enquêtes lorsque cela est possible.
Le data journalisme et l’intelligence artificielle
FD : L’intelligence artificielle (IA) offre de nouvelles possibilités sur les traitements des données. Utilises-tu l’IA dans ton métier de data journaliste ?
RA : Nous prenons beaucoup de précautions par rapport à l’utilisation de l’IA. Pour l’instant, je l’utilise surtout comme « assistant » lorsque je code (Cursor et Github Copilot). Et je dois dire que pour certains besoins précis, ces outils me font gagner du temps.
FD : Penses-tu que l’IA aura des conséquences sur le data journalisme et par extension le journalisme à moyen terme ?
RA : L’IA a déjà des conséquences sur notre métier car nous y avons recours lorsque nous codons. Ses usages demeurent toutefois assez limités pour l’instant, et nous restons vigilants pour en faire une utilisation responsable, cadrée. L’IA devient aussi un sujet pour nous et pour nos collègues, notamment au service Pixels, qui parle de la vie numérique et des nouvelles technologies.
Data journaliste : quel salaire ?
FD : Enfin, sur le blog Geomatick, j’ai l’habitude de demander le salaire du métier présenté. Peux-tu nous donner une fourchette de salaire annuel brut d’un(e) data journaliste ?
RA : Les data journalistes sont considérés comme des journalistes multimédia « classiques », donc nos compétences ne sont théoriquement pas (encore ?) reconnues en termes de salaire. Les salaires d’entrée se trouvent autour de 33 000 euros bruts et montent ensuite avec l’ancienneté (autour de 48 000 euros bruts annuels après dix ans).
FD : Raphaëlle, je te remercie pour cette discussion passionnante. Je te souhaite une bonne continuation et nous avons hâte de lire tes prochains articles sur le journal Le Monde.
N’hésitez pas à commenter et poser vos questions à Raphaëlle à la suite de ce post.