Analyse de données non structurées : le cas Complidon

En 2017/2018, Epiconcept accompagne Santé Publique France pour son enquête Complidon. Cette étude anonyme en ligne avait pour objectif d'évaluer l'opinion et le comportement des donneurs de sang par rapport aux critères de sélection. 

L'enjeu : traiter le volume de textes libres 

L'enquête est un succès : 110 000 donneurs de sang y participent. Pour en tirer le meilleur parti, le traitement des réponses libres est essentiel. Or leur volume est massif et difficile à compiler par l'homme. 

Pour résoudre ce problème, Santé Publique France choisit d'utiliser "Feedback Explorer". Conçu par Epiconcept, cet outil recourt à Spark, un framework Open Source de calcul distribué. Les algorithmes de traitement du langage naturel développés par ce biais permettent d'agréger les réponses en clusters sémantiques facilitant le regroupement thématique et l'analyse. 

Capture d’écran 2019-07-01 à 15.30.25