14h15-15h00 Intervention théorique 5, Sophie Pène. Indisponibles données : Les belles endormies de l’éducation (afficher le résumé)
La proposition porte sur les données de l’éducation. Elle vise à décrire l’état de maturité de la « donnée » (2021), et plus précisément de l’open data, dans les discours professionnels de l’administration centrale de l’éducation et de la recherche. Impossibles à produire, trop sensibles pour être partagées, marginales dans un environnement sidéré par sa propre complexité, les données de l’éducation ont été cependant en 2021 un sujet porté par la politique gouvernementale. Selon un site du MESRI (enseignement supérieur, recherche et innovation) « Ouvrir la science », « Le potentiel des données d’enseignement supérieur et de recherche, ainsi que des données administratives et de pilotage de l’enseignement supérieur, de la recherche et de l’innovation est encore trop peu exploité, malgré les efforts déjà engagés. Pourtant, une meilleure gestion des données permettrait un gain important de valeur scientifique, économique et d’efficacité collective ». Du côté du MENJS ( éducation nationale, jeunesse et sports), le rapport du comité d’éthique des données de l’éducation précise : « Le secteur du numérique éducatif ouvre un nouveau champ des possibles pédagogiques par le recueil, l’analyse et l’exploitation des données d’éducation. Ces potentialités nouvelles doivent d’abord être au bénéfice des élèves et de leurs familles, des professeurs, des chercheurs en éducation mais doivent aussi éclairer le pilotage du système éducatif. »
Si la donnée ouverte est l’objet d’une politique numérique des deux ministères concernés (selon l’organisation actuelle du gouvernement, MESRI et MENJS), il apparaît que ces deux ministères qui réunissent plus de 12 millions d’usagers, en comptant les seuls élèves et étudiants, indépendamment des familles, et plus d’un million d’enseignants, ont relativement peu de jeux de données ouverts, au regard de leur puissance statistique. De plus ces jeux sont ponctuels, aléatoires et discontinus (analyse de data.gouv, rubrique éducation). Ils ne permettent pas d’évaluation systématique et participative du service public de l’éducation en France. Par ailleurs ces deux ministères ont de solides services statistiques qui publient de nombreuses études, à partir de données traitées et agrégées sans pour autant partager les jeux de données.
L’hypothèse examinée est purement potentielle : l’ouverture méthodique de données descriptives du système éducatif aurait-elle un effet sur l’appropriation de l’éducation comme bien commun par la communauté sociale ? En somme la critique de l’éducation par les médias, les politiques et les usagers pourrait-elle évoluer si les données décrivant le service public exprimaient une redevabilité et une transparence du service public de l’éducation ?
Si les deux ministères, en particulier le MENJS, qui se distingue au sein des autres ministères par le niveau de contrôle exercé par le cabinet sur les données publiées, et par un haut degré de définition des « données sensibles », augmentaient le flux et la complémentarité des données publiées, à quelles conditions cela pourrait-il améliorer la reconnaissance par des communautés (éducatives, informatiques, associatives) de la qualité du système éducatif et de sa valeur pour le pays ?
L’hypothèse peut paraître anecdotique et difficile à examiner. Elle permet cependant d’expliciter les thèses sous-jacentes aux réticences, difficultés ou au contraire investissement de l’open data et de passer en revue les appels actuels à leur ouverture. Considérons qu’elle permet aussi d’évaluer avec quelques années de recul les thèses développées dans plusieurs travaux sur le rôle des données ouvertes dans les politiques de modernisation de l’Etat français (Goëta, 2016 ; 2017 Denis, 2017, 2020, Auray, 2013 ; Bellon, 2017) , autour de l’idée que l’open data a été un instrument dans ces politiques et a introduit la notion de communs numériques dans le discours d’Etat (Shulz, 2021).
En analysant les occurrences de « données ouvertes » en contexte, il s’agit donc d’examiner si l’éducation occupe une place particulière (par son niveau de fermeture) , éventuellement en contradiction avec l’intérêt que les sujets éducatifs éveillent, et de proposer des explications (organisationnelles, techniques, éthiques). Pour interroger cette possible spécificité, on utilisera différentes sondes :
– Etude (rapide) depuis le point d’origine d’une politique de la donnée ouverte, l’année 2013, avec l’arrivée d’Henri Verdier à la direction d’Etalab, et le développement du site data.gouv, qui seront les bases d’un discours public sur l’open data, et l’innovation publique, par l’ouverture des monopoles informationnels de l’Etat.
– Etude terminologique du vocabulaire désignant les données : comparaison lexique statistique vs lexique data sciences, catégories descriptives (i.e : données de l’apprentissage, données PISA, données personnelles, données éducatives, données de la recherche), telles qu’émanant des textes officiels (circulaires, rapports), de la nomenclature des services et des libellés de poste, des discours des acteurs lors des entretiens.
– Etude comparative « données de l’éducation 2021 vs données de la santé 2019 ». Les données de la santé ont connu un affinement récent, à la suite du rapport Pon (regroupements thématiques, caractérisation accrue, terminologie enrichie, définition des services producteurs, gestionnaires et utilisateurs), mais aussi sous le booster qu’a représenté la pandémie Covid-19 en termes de valorisation sociale des données ouvertes, constituant cellles-ci comme une « cause » d’intérêt général.
– Etudes des textes officiels invitant à lier politiques d’ouverture de la donnée et politiques d’innovation. (Rapport Bothorel, ( 23/12/2020), Circulaire du premier ministre « Données, algorithmes et codes sources »(27 avril 2021), feuilles de route de 15 ministères et nomination d’un ou une administrateur des données dans chaque ministère ( septembre 2021)
Cette proposition est un segment d’un enquête portant sur la politique numérique éducative (octobre janvier 2021), entretiens, analyses de documents et observations, au MESRI et au MENJS, et s’inscrit dans le champ d’une description sociale de la donnée, considérée comme préfigurant les possibilités et impossibilités d’une production technique de la donnée, en relation ou non avec une approche dite data by design.