[Cet article a été co-écrit avec l'équipe de WeDoData]

Dans le cadre d’un projet pour Radio France, WeDoData, spécialiste de datavisualisations, s’est associé avec Syllabs pour proposer un regard original sur la relation Franco-Allemande.

logo Radio Francelogo_wedodata

 

Une exploration des mots de l’amitié franco-allemande

Le traité de l’Elysée était signé le 22 janvier 1963 entre le Général de Gaulle et Konrad Adenauer. Il y a 50 ans, la réconciliation des “ennemis héréditaires” prenait ainsi forme. Comment traiter de façon originale un évènement politique et diplomatique tel que celui-ci ? Comment explorer 50 ans d’Histoire commune sous un nouvel angle ?

 

Une analyse sémantique

Avec un accord officiel comme point de départ, la “matière première” de ce travail s’est imposée d’elle-même : les textes qui ont rythmé ces 50 ans de bilatéralisme.

Les chef d’Etats ont-ils toujours eu le même discours ? Les éléments de langage – même diplomatiques – ont-ils évolué au fil du temps ? Les thèmes de débat ont-ils changé avec les décennies et le contexte géopolitique ?

Depuis 50 ans, les Sommets franco-allemands se sont succédé au rythme de deux par an (en 2003, un Conseil des ministres commun a même été institué). Nous avons ainsi pu reconstituer un corpus de 134 discours ou interventions publiques : 55 tenus par des présidents français, 55 par des chanceliers allemands et 24 déclarations communes. Les trois-quarts des textes ont été retrouvés en ligne, le quart restant a été repris de l’ouvrage de référence sur le sujet “Les Relations franco-allemandes depuis 1963“, de Pierre Jardin et Adolf Kimmel (La Documentation française, Paris, 2001).

Afin de mieux comprendre ces discours, WeDoData a sollicité  le savoir-faire et la technologie développés par Syllabs. Ainsi, nous avons pu réaliser une analyse sémantique fine du corpus pour en extraire les termes signifiants, leur utilisation au fil des années ainsi que leurs associations. Ces analyses ont alors permis de comprendre les évolutions des éléments de langage sur les grands thèmes de société.

Concrètement, l’analyse sémantique a fait émerger 975 termes récurrents parmi les 134 textes officiels. Nous nous sommes concentrés sur les 300 premiers. Parmi ceux-ci, nous avons ôté tous les mots généraux, tels que “politique”, “action” ou encore “réflexion”, pour obtenir une première vague de mots pertinents en terme de quantité, mais aussi de qualité éditoriale. Enfin, l’application de la méthode TF-IDF (Term Frequency – Inverse Document Frequency) a permis d’évaluer l’importance de ces termes, relativement à la taille du corpus, faisant émerger les 25 termes finaux.

TF-IDF

La technologie Syllabs a également permis de faire émerger les mots qui leurs étaient associés (mots cooccurrents).

Un exemple simple : Le mot “Nucléaire” ne va pas avoir la même signification s’il est employé avec les mots “Armes”, “Sûreté” ou encore “Essais”.

Cette collaboration entre WeDoData et Syllabs a permis d’aborder un terrain éditorial nouveau. Non seulement l’analyse sémantique a révélé l’intention première et montré l’évolution des thèmes dans le temps, mais elle est a également permis l’analyse des cooccurrences afin d’affiner l’étude de l’utilisation des mots et donc du débat en cours.

co-occurrences

 

Deux types de visualisations

A partir des extractions réalisées par Syllabs, une visualisation dynamique en 2 parties a été réalisée .

1) La première montre l’évolution de l’ensemble des 25 mots de 1962 à 2013 :

home

2) La deuxième permet d’explorer l’évolution quantitative d’un terme dans le temps, ainsi que ses principales cooccurrences.

mot

Sur cette page, l’Internaute a aussi la possibilité d’ajouter des fonds d’informations : politique, économique, européen et international. Il peut ainsi mettre en regard la donnée quantitative du mot et le contexte géopolitique du moment.

Par exemple, le mot guerre connaît une grande utilisation dans les années 1990, décennie de combats en ex-Yougoslavie et dans le Golfe. Il est réapparu fortement en 2012, année de la guerre en Libye qui a mobilisé les Européens.

Un nouveau terrain pour la datavisualisation 

L’analyse sémantique est un prisme encore trop peu utilisé dans le datajournalisme. L’association du traditionnel trio journaliste/designer/developpeur à des spécialistes du langage permet de faire remonter des informations jusqu’ici peu explorées.

Cette application montre qu’avec une technologie innovante, nous pouvons pousser ce type d’analyse encore plus loin : http://france-allemagne.radiofrance.fr

WeDoData et Syllabs

 

3 Responses to France – Allemagne : 50 ans mot à mot

  1. Viaud says:

    travail très interessant!!
    MLV

    • Christophe says:

      Merci. Ce fût l’occasion de mettre nos téchnologies et nos savoir-faire au service de journalistes et ainsi de partager une expérience très enrichissante.