Archives de l’auteur : Gérald Kembellec

Séminaire Data – Document – Médiation – 3 juin 2026 – 9h30-12h30

Thématiques : Data — mbre principal — mbre secondaire — sponsable de la thématique

Lien Teams : https://teams.microsoft.com/meet/33378266399862?p=mTXsdrk8sQB6qzQF8r

La communication Humains-données.

Séminaire Data · Document · Médiation – 3 juin 2026, 9h30-13h, CNAM, 2 rue Conté, Paris 3, métro Arts et Métiers. Salle 31.2.87 (accès 31 au 2ème étage, salle 87).

Rejoindre

Argumentaire

Nous vivons un moment charnière dans l’histoire des relations entre les humains, les technologies et les données.

Pendant plusieurs décennies, la relation entre l’humain et la machine a été pensée selon une logique relativement asymétrique : l’humain produisait du sens, prenait les décisions et interprétait le monde ; la machine stockait, calculait et exécutait. Les données apparaissaient alors comme de simples traces ou ressources au service de l’activité humaine.

Aujourd’hui, cette relation s’est profondément transformée. Les systèmes numériques contemporains ne se contentent plus d’enregistrer les activités humaines : ils les modélisent, les interprètent et influencent en retour les comportements individuels et collectifs. Dans le domaine de l’éducation, cette évolution prend une dimension particulière. Les données ne servent plus seulement à documenter les apprentissages ; elles prétendent désormais les accompagner, les orienter, les prédire et parfois même les définir.

C’est cette transformation des rapports entre humains, données et systèmes algorithmiques que nous souhaitons interroger aujourd’hui.

Trois tensions structurent notre réflexion.

1. Transparence et opacité

Les systèmes d’intelligence artificielle mobilisent des volumes considérables de données comportementales, cognitives ou relationnelles. Pourtant, les mécanismes qui transforment ces données en évaluations, recommandations ou décisions demeurent souvent difficiles à comprendre.

Dans le contexte éducatif, cette opacité concerne aussi bien les apprenants que les enseignants ou les institutions. Quels critères sont mobilisés ? Quels modèles sont utilisés ? Selon quelles logiques certaines recommandations sont-elles produites plutôt que d’autres ? La promesse d’une décision fondée sur les données se heurte ainsi à la difficulté d’en rendre les mécanismes intelligibles.

2. Personnalisation et normativité

L’une des promesses les plus attractives de l’intelligence artificielle réside dans sa capacité à personnaliser les parcours d’apprentissage. Mais personnaliser à partir des données implique également de catégoriser, de comparer et de prédire.

Derrière chaque recommandation se trouvent des modèles qui définissent implicitement ce qu’est un apprenant « typique », un parcours « optimal » ou une réussite « attendue ». La personnalisation risque alors de devenir un vecteur de normalisation. Une question centrale apparaît : quelles traces de ces décisions restent accessibles à la discussion, à la critique et à la contestation ?

3. Agentivité et délégation

L’humain n’est jamais un simple récepteur des prescriptions algorithmiques. Il interprète les recommandations, les négocie, les détourne ou les contourne. Son agentivité demeure réelle.

Cependant, jusqu’où cette capacité d’action peut-elle s’exercer lorsque l’environnement informationnel lui-même est structuré par des données, des indicateurs et des modèles qu’il n’a ni choisis ni construits ? À mesure que certaines fonctions cognitives, pédagogiques ou décisionnelles sont déléguées aux systèmes algorithmiques, la question n’est plus seulement celle de l’efficacité technique, mais aussi celle du partage du pouvoir d’agir.

L’interface humain-données apparaît alors comme bien davantage qu’un simple dispositif technique. Elle constitue un espace de médiation où se négocient la visibilité, l’interprétation et le contrôle des informations. En ce sens, elle est également un enjeu de pouvoir communicationnel, cognitif et politique.

La question n’est donc plus seulement de savoir comment les données représentent les activités humaines, mais comment elles participent désormais à leur organisation, leur interprétation et leur gouvernance.

Interroger les interfaces humain-données revient ainsi à examiner les nouvelles formes de médiation qui émergent au croisement de la technique, de la connaissance et du pouvoir.

Muriel Frisch : 9H30-9H45 ou 10h – Introduction
Anna Nesvijevskaia : 10h-10h45 – « Humains, données, IA : vers de nouvelles médiations » ;
Karim Fraoua : 10h45-11h30 – « Médiation algorithmique et agentivité communicationnelle dans l’interaction éducative humain ? » ;
Olufade F. Williams Onifade : 11h30-12h15 – « Beyond Algorithms: Reimagining Human Intelligence, Data, and AI in the Future of Learning » .

Détail des présentations

Anna Nesvijevskaia – HEG, Genève, Suisse.« Humains, données, IA : vers de nouvelles médiations ? »

Pourquoi tant de projets IA restent-ils sans impact réel malgré des technologies toujours plus performantes ? À partir de dix années de recherche-action et d’une douzaine de projets, cette intervention propose une réponse : les projets Data Science ne peuvent réussir qu’en présence d’un nouveau type de médiation, encore trop peu étudiée : la Médiation Humains-Données. En proposant un cadre théorique original, le modèle BRIZO, Anna
Nesvijevskaia décrit 5 leviers de médiation pour huiler ce mécanisme clé de création de valeur, en replaçant l’usage et les décisions humaines au centre des projets Data Science marqués par de fortes incertitudes. A travers l’identification des conditions organisationnelles et méthodologiques nécessaires à l’activation des usages dans les projets Data Science, il s’agit non seulement de proposer de nouvelles pratiques, mais également d’ouvrir des portes interdisciplinaires pour développer les métiers data de demain.

Karim Fraoua – Université Eiffel, France. « Médiation algorithmique et agentivité communicationnelle dans l’interaction éducative humain–IA. Une lecture par les SIC »

Nous nous sommes posé la question, lorsqu’un apprenant interagit avec un grand modèle de langage (LLM), qui contrôle réellement l’échange ? La qualité des productions de l’IA dépend directement des choix communicationnels de l’utilisateur, faisant du prompt bien plus qu’une requête technique mais un un acte de négociation discursive. Or à notre connaissance, la littérature SIC manquait d’un cadre théorique intégré pour analyser cette interaction.

Olufade F. Williams Onifade – Nigeria, « Beyond Algorithms: Reimagining Human Intelligence, Data, and AI in the Future of Learning »

We live in a time where artificial intelligence is no longer confined to research laboratories or technology companies. It now shapes how we learn, communicate, work, and even make decisions. Yet, beyond the power of algorithms and data lies a deeper question: What remains uniquely human in an increasingly intelligent digital world?

Bearing in mind the palpable fear of human displacement by AI, this presentation explores the meeting point between human intelligence, data, and artificial intelligence, with a special focus on education, communication, and social interaction. It invites the audience to look beyond the technical side of AI and reflect on how these technologies are transforming classrooms, workplaces, and everyday life.

For example, in education, AI-powered learning platforms can help a student in Nigeria learn mathematics at a personalized pace, while in Europe, intelligent translation systems can allow French-speaking and English-speaking students to collaborate seamlessly across borders. In healthcare, data-driven systems can assist doctors in identifying diseases earlier, yet human compassion and ethical judgment remain irreplaceable. In communication, recommendation algorithms may influence what we read, watch, and believe—raising important questions about trust, bias, and digital responsibility.

We can boldly assert that technology may become smarter, but the future will still belong to those who know how to combine intelligence with wisdom, data with ethics, and innovation with humanity.

La grille de la connaissance. Pour une histoire culturelle du tableau

Thématiques : Data — mbre principal — sponsable de la thématique

Présentation de Werner Scheltjens (univ. Bamberg), « La grille de la connaissance. Pour une histoire culturelle du tableau », commentaire depuis les SIC par Gérald Kembellec, les humanités numériques et la data analyse.

https://www.dhi-paris.fr/fr/agenda-detaillees/2026-jeudi-scheltjens.html

Que pouvons-nous apprendre de tableaux pré-numériques ? Sont-ils de simples précurseurs des formats actuels de sauvegarde et d’échange, ou bien des textes non narratifs ? Werner Scheltjens constate que nos connaissances sur l’histoire des tableaux pré-numériques demeurent limitées. Bien que nous les utilisions constamment, nous nous intéressons que rarement aux tableaux en tant qu’artefacts culturels.

Crédit image : Astronomisch-astrologisch-mantische Sammelhandschrift, Universitätsbibliothek Freiburg i. Br., Hs. 458.

Les tableaux sont des témoins muets de la relation continue entre humains, données et savoir. Ils permettent de saisir la manière dont les besoins d’information ont été compris et satisfaits dans leur contexte historique, que ce soit dans l’Antiquité, au Moyen Âge ou au XXᵉ siècle. Chaque tableau condense et révèle l’interaction entre les données présentées, leur finalité, les opérations cognitives qu’il est censé faciliter, le public cible et les contraintes matérielles du support de diffusion. Partant de cette observation, la conférence esquisse des premières réflexions pour une histoire culturelle du tableau. Quelle contribution une analyse historique des tableaux peut-elle apporter à l’histoire de la modélisation des données et du savoir ? Comment les tableaux ont-ils contribué à la production et à la diffusion de connaissances ? Ces questions seront au centre de la conférence. Gérald Kembellec (CNAM) en assurera le commentaire.

Werner Scheltjens est professeur d’histoire numérique à l’université de Bamberg.

Conférence avec traduction simultanée (français/allemand).

Pour une participation sur place, aucune inscription n’est nécessaire. Pour participer en ligne, merci de vous inscrire via le lien ci-dessus.

Bien à vous,

Gérald

Séminaire thématique « Data · Document · Médiation » .

Thématiques : Data — mbre principal — mbre principal — mbre secondaire — sponsable de la thématique

Programme prévisionnel, détails à suivreimage générée avec l’IA ChatGPT

9 janvier de 14h à 17h ~~salle 30-1-24~~ (uniquement via Teams) : IA et Web sémantique : séance de table ronde animée par Gérald Kembellec avec Xavier Aimé et Marcello Vitali-Rosati
22 janvier de 9h30 à13h, salle 30-(-)1-24 au Cnam* : Gouvernance de données : séance animée par Ghislaine Chartron, avec Nathalie Pinède et Guy Mélançon (projet ANR ACT) Gouvernance de données en contexte universitaire) + doctorants
16 avril (après-midi) : nouvelles formes d’écriture scientifique, éditorialisation : séance animée par Camille Claverie avec Antonin Segault, (Hypotweet), sous réserve : Roch Delannay (Thèse), Andréas Verner (évolution de la forme d’expression sur Hypothèses) …
mai/juin : nouvelles tendances en IA : séance animée par Karim Fraoua. Participation sous réserve de Lionel Barbe (Blockchain…)

* Voir le plan d’accès : la salle 30.1.24 est en sous sol, accès 30, étage -1, salle 24.

Journée d’études « Mise en données du fait historique » avec l’Institut Historique Allemand

Thématiques : Data — mbre principal — sponsable de la thématique

Conférence Keynote donnée par Ann Blair (univ. Harvard), « The Role of People in Managing Information, Past and Present » le 21.05.2025à 18h00 à l’Institut Historique Allemand

Enregistrer dans mon agenda

Dans le cadre de la journée d’étude coorganisée par le Dicen-IdF en partenariat avec l’IHA «Mise en données du fait historique. Enjeux, méthodes et modélisations» (programme).

Organisation :
Gérald Kembellec (CNAM), Pauline Spychala (IHA)

Dans Tant de choses à savoir (2020), Ann Blair a montré les racines profondes de la gestion de l’information dans les méthodes de lecture et d’écriture des textes à l’époque pré-moderne. Elle s’est concentrée ce qu’elle a appelé les 4S: sélectionner, trier, résumer, stocker, qui, selon elle, sont caractéristiques de nombreux projets encyclopédiques. Dans ce livre, elle établissait des parallèles avec le contexte médiatique dans lequel était écrit l’original anglais (Too Much To Know, 2010), soit dans les années 1999–2009. Compte tenu de l’évolution du paysage numérique depuis lors, elle compte revisiter les 4S afin de réfléchir aux transformations de ces différentes opérations par les outils et techniques numériques et à quel point l’intervention humaine dans ces opérations reste cruciale.

Commentaire: Pr. Cédric du Mouza (CNAM) et Dr. Sébastien Poublanc (CNRS/FRAMESPA)

Pour une participation sur place, aucune inscription n’est nécessaire.
Pour participer en ligne, merci de vous inscrire ici: Zoom.

Événement en anglais et en français

En coopération avec l’Institut Historique Allemand

Crédit image: Gilbert de Cousin, Effigies Des. Erasmi Roterodami literatorum principis, Bâle 1553, p. 8–9; Bibliothèque universitaire de Bâle, UBH AN VI 4a (CC-BY-SA 4.0, https://doi.org/10.3931/e-rara-1794)

Cette conférence a lieu dans le cadre de la journée d’étude «Mise en données du fait historique. Enjeux, méthodes et modélisations» à l’IHA. La journée d’étude n’est pas ouverte au public, à l’exception de la conférence de clôture dont l’entrée est libre.

Institut historique allemand
Hôtel Duret-de-Chevry
8 rue du Parc-Royal
75003 Paris

Séminaire Data, médiation, valorisation

Thématiques : Data — sponsable de la thématique

Journée d’étude de la thématique
« Data, médiation, valorisation »

Le 15 avril à partir de 10h – Amphi Jean Prouvé (Côté saint Martin, accès 11, r-ch) au Cnam
Co-animée par Béa Arruabarrena, Gérald Kembellec et Karim Fraoua (poster une déclaration d’intention ou poser une question)

–> PROGRAMME <–

« Place des données dans les sciences de l’information et de la communication : usages, usagers et applications » (clickez pour afficher/cacher la suite de l’appel)

La journée d’études spéciale « data, médiation, valorisation » du Laboratoire DICEN-IdF se tiendra le 15 avril prochain au CNAM. Nous y discuterons les phénomènes data sous plusieurs angles disciplinaires : Info-communicationnel comme axe d’ancrage bien sûr, mais aussi en convoquant des postures issues notamment de l’anthropologie, de la sociologie ou même de la philosophie. L’objectif de cette journée d’étude est faire un état des travaux de recherche interne au Laboratoire DICEN-IdF sur le phénomène des datas par leurs contributions épistémologiques, méthodologiques et appliquées s’intéressent aux problématiques de data dans leurs rapports entre humains et société au regard des enjeux sociotechniques, sociocognitifs, organisationnels, socioéconomiques, politiques et éthiques qu’elles soulèvent.

A l’heure où la mise en données des activités humaines par n’a jamais été aussi importante, les technologies numériques produisent des données de manière de plus en plus massive, qui elles obligent à repenser les relations humaines, le fonctionnement de la société et les modalités de la production de nouveaux savoirs appuyés sur les contenus. Ces avancées majeures impactent nos réflexions sur la relation humaine au sens de l’interface humain-machine que ce soit par l’extension technologique de l’IOT (et des objets connectés), l’émergence de l’intelligence artificielle, le Web sémantique, le traitement des données massives, mettant en œuvre des algorithmes et des méthodes d’analyse quantitative de données de plus en plus sophistiqués, telles que le Machine Learning pour la prédiction et le Deep Learning pour la reconnaissance faciale ou encore le traitement automatique des langues avec par exemple. Toutes ces évolutions technologiques ont un impact d’ordre cognitif et anthropologique non seulement dans leur conception (design) basés sur les ressorts de la psychologie cognitive et sociale, et les récentes découvertes des neurosciences que dans leurs usages où les dispositifs data interviennent désormais dans toutes nos décisions. Ces innovations technologiques occasionnent également le développement de nouvelles formes de « gouvernementalité » pour la société, telles qu’on peut le voir avec l’utilisation des traces comportementales, ou encore avec l’intensification de plateforme de données, des API et l’automatisation des procédures portés par l’action publique par exemple. La question de l’impact de la donnée est aussi cruciale sur la production de savoir pour les recherches en sciences sociales. Ce sont aussi les questionnements éthiques tant sur le plan de la protection des données que celui de la protection des personnes qui sont convoqués.

Ce séminaire sera organisé en deux parties. Dans une première partie, il s’agira d’aborder les travaux d’ordre théorique et méthodologique visant à problématiser d’un point de vue disciplinaire, la médiation et de la valorisation des données et les enjeux associés au sein de notre société. Nous questionnerons alors la manière dont on peut analyser les dispositifs producteurs ou consommateurs de données comme « objets frontières » entre les disciplines et quelle est la porosité des dites frontières sur ces sujets. Dans la deuxième partie, nous explorerons les aspects applicatifs (expérimentation, cas d’usages, etc.) qui questionnent, mettent en œuvre ou soulèvent des problématiques de données pour la société, dans des domaines aussi variés que la santé, l’éducation, la ville, l’écologie, le marketing et la documentation, etc.

Modalité de participation

Les contributions peuvent couvrir différents champs sur ce qui a été exposé, il faut proposer pour le 15~~janvier~~ février 2022 un résumé d’une page maximum adressée à Gérald Kembellec, Karim Fraoua et Béatrice Arruabarrena (avec une courte bibliographie en cas d’intervention extérieure au laboratoire, sur proposition d’un membre du Laboratoire). Il faudra préciser dans le courriel si vous souhaitez participer sur la partie « théorique » ou dans la partie « appliquée » de l’après-midi, ou encore s’il s’agit de discuter un texte lors de la section doctorale.

Chaque présentation durera environ 20-15 minutes et sera suivie d’échanges avec les participants.
Les propositions des doctorants sont encouragées, surtout s’il y a un enjeu de présentation scientifique ultérieure lors d’un congrès (comme H2PTM, SFSIC…) ou encore du séminaire doctoral. Une session est spécifiquement dédiée en fin de journée à la discussion des textes de doctorants.

Programme prévisionnel du séminaire

Matin – Data et usages : Dimensions philosophique / anthropologique et techniques

10h Introduction : Gérald Kembellec & B. Arruabarrena & K.E Fraoua
10h15-11h00 Intervention théorique 1, Armen Khatchatourov: Deux figures de Big Data. (afficher le résumé)

En examinant les technologies et les discours à l’œuvre dans Big Data, nous proposons d’y distinguer deux tendances en partie concurrentes qui permettent de décrire les nouveaux « diagrammes » du pouvoir, les modes de gouvernementalité qui leur correspondent, ainsi que leurs relations complexes avec les savoirs constitués.

On postule aujourd’hui que nos savoirs dépendent de plus en plus des « données » obtenus à l’aide de Big Data. L’approche critique de ce champ, d’abord structurée par des enjeux épistémologiques, thématise la manière dont ce nouveau paradigme redéfinit la constitution des savoirs. Après une brève restitution de ce débat dans le but d’en dégager quelques éléments distinctifs et problématiques, nous allons tenter de le compléter par une approche dont l’aspiration est de dépasser les problèmes strictement épistémologiques pour s’acheminer vers ceux de l’exercice du pouvoir, en amont de la constitution des savoirs particuliers. Pour ce faire, nous tenterons de dégager le diagramme d’aujourd’hui, dans le sens où ce terme est employé par Gilles Deleuze, à savoir une représentation, une exposition « des rapports de force qui constituent le pouvoir ».

Cette analyse, convoquant également le paradigme cybernétique ici en jeu, nous amène à formuler l’hypothèse suivante : il en va désormais non pas simplement d’une nouvelle forme historique de la relation entre les savoirs et le pouvoir mais de l’auto-actualisation indéfinie de ce dernier.
11h00-11h45 Intervention théorique 2, Dario Compagno. Au-delà des big data : pour une approche model based aux données des SHS (afficher le résumé)

Les dernières années ont vu une explosion de recherches basées sur des algorithmes
capables d’extraire de l’information de manière purement inductive à partir de grandes
bases de données. Ces approches permettent par exemple de réaliser des annotations en
imitant l’agir humain (algorithmes supervisés) et même de détecter des formes invisibles à
l’œil humain, c’est-à-dire des nouveaux observables (Rastier), sur la base d’associations
parmi un grand nombre de petits traits pertinents (algorithmes non-supervisés). Les
dernières technologies permettent d’intensifier la puissance de ces approches, par exemple
grâce aux réseaux de neurones, qui identifient eux même les traits les plus pertinents pour
une certaine tâche, et implémentent donc une approche de plus en plus créative et
“humaine”. On a dit que grâce aux algorithmes on serait donc entrés dans un quatrième
paradigme de la recherche scientifique, où les corrélations auraient substituées le recours à
des modèles interprétatifs formulés à partir de théories, et cela avant de collecter des
données. Certaines limites des algorithmes inductifs sont connues, et notamment leur
opacité. Pour cette raison, les chercheurs se concentrent aujourd’hui dans le développement
d’algorithmes plus facilement interprétables.
Mais même au net de leurs problèmes d’opacité, les algorithmes inductifs souffrent d’une
grande incapacité, d’une faiblesse qui dérive directement de la statistique traditionnelle sur
laquelle ces algorithmes se basent. La statistique classique en effet ne sait pas passer d’une
corrélation observée dans les données à son interprétation, notamment causale (Fisher). Et
effectivement les algorithmes inductifs sont juste des puissantes machines à corrélation : ils
identifient des configurations mais ils ne peuvent pas leur attribuer du sens. Depuis une
vingtaine d’années, au contraire, une nouvelle famille d’approches se pose la question de
formaliser les conditions en accord avec lesquelles certaines corrélations peuvent être
interprétées causalement (Pearl). Cela permet de répondre à des vraies questions
scientifiques, pour lesquelles des simples configurations de corrélations seraient
insuffisantes ou pourraient même induire des lectures trompeuses. Les modèles causaux
sont des dispositifs hypothético-déductifs qui apportent de la connaissance qualitative aux
données, et permettent d’intégrer le travail des algorithmes (appliqués d’ailleurs souvent à
des “small” data) dans une vraie perspective de recherche.
Notre intervention présente ces approches model based, vis-à-vis des algorithmes inductifs,
et se concentre sur leur applicabilité aux sciences de l’homme. En effet, les modèles
causaux visent des interprétations causales des données, mais il n’est pas dit que cela soit
suffisant pour les SHS (Geertz, Eco). Nous proposons donc une extension des méthodes
causales visant à saisir le sens de données qui sont déjà signifiantes, qui sont déjà des
signes avec leur intentionnalité (Searle), et pour lesquels une lecture causale ne serait pas
adéquate.
11h45-12h30, Intervention théorique 3, Karim Fraoua et Amos David. Émergence de la Blockchain dans l’espace numérique, une nouvelle identité partagée.
Pause /déjeuner libre

Après midi – Data et usages : Dimensions éducatives et data literacy

13h30-14h15 Intervention théorique 4, Ugo Verdi, Resituer la data literacy dans son écosystème littératien (afficher le résumé)

La donnée, objet conceptuel ayant connu une nouvelle mise en lumière avec l’évocation
des big data, de l’open data, de l’intelligence articielle et des algorithmes, considérée
comme le” nouveau pétrôle du XXIe siècle” (Haupt 2016) et comme avantage compétitif
certain (CNIL and BpiFrance 2018), est l’objet de guerres commerciales et l’enjeu de
débats citoyens récurrents notamment dans le cadre de l’appropriation des données
personnelles et des impacts de la datafication. Dans ce contexte, la_ data literacy_ est
alors souvent vue comme la solution miracle pour la formation de “lettrés de la donnée”
(data literate). Or, si cette nécessité d’une maitrise des données est constamment
évoquée, réaffirmée avec la crise de la Covid-19 (Commission Européenne 2020), nous
constatons toutefois un manque de clarté sur l’ancrage de la_ data literacy_ dans un
écosystème littératien complexe et profifique; la data literacy elle-même ayant connu et
continuant de connaitre des évolutions.
L’héritage de la data literacy est double, ancrée d’une part dans l’histoire de la donnée,
et ancrée d’autre part dans la logique de la littératie, à savoir l’étude des effets de la
lecture et l’écriture sur la cognition humaine (Olson and Lejosne 2006), remise en
lumière par les travaux de Jack Goody. La littératie elle-même est traversée de plusieurs
courants, que Sreet nomme “autonome” et “idéologique” (Street 2006) dont les
implications techniques et culturelles façonnent les visions implémentées dans les
littératies qui ont pu naitre par la suite (ex : Information Literacy, Data Literacy, etc.).
Et par-delà la littératie elle-même, la data literacy est imbriquée dans un écosystème de
littératies, dont le nombre total ne peut être quantifié notamment du fait que les
frontières entre elles sont de plus en plus floues (Le Deuff 2012). Toutefois, plusieurs
partagent une même appétence pour les données et en font leur matériau d’étude pour
leurs analyses. Il est à souligner que plusieurs littératies ont précédé la data literacy
dans l’étude des données et existent toujours actuellement. Du fait de leur ancrage,
elles influencent la vision des données et in extenso de la data literacy, en particulier la
statistical literacy (Shields 2005). De fait, la place de la data literacy, ses interactions vis-
à-vis des autres littératies, tend à l’instabilité, les visions de sa nature divergeant selon
les auteurs.
Et si nous parlons ici de la data literacy sous l’angle d’une littératie monolotique, aux
définitions et compétences bien arrêtées (dont les auteurs les plus connus ayant
travaillé sur cette thématique sont notamment (Gummer and Mandinach 2015) et (Prado
and Marzal 2013)), c’est parce qu’elle a constitué une remise en cause ayant abouti à la
crétion de nombreuses data literacies spécialisées dans un domaine spécifique (ex : la
pedogical data literacy (Mandinach 2012)), des compétences spécifiques (ex : la data
visualisation literacy (Börner, Bueckle, and Ginda 2019)) ou encore des données
spécifiques (ex : la big data literacy (Bhargava 2015)),. Les raisons évoquées sont
multiples : manque de compétences spécifiques, nécessité d’une extension du domaine
d’analyse ou encore dénomination inadéquate.
Ainsi, l’objectif de cette contribution est d’apporter un éclairage épistémologique de la
data literacy en rappelant héritage littératien de la data literacy, en analysant ses
interactions avec les littératies voisines et enfin en traitant ses diverses spécialisations.
14h15-15h00 Intervention théorique 5, Sophie Pène. Indisponibles données : Les belles endormies de l’éducation (afficher le résumé)

La proposition porte sur les données de l’éducation. Elle vise à décrire l’état de maturité de la « donnée » (2021), et plus précisément de l’open data, dans les discours professionnels de l’administration centrale de l’éducation et de la recherche. Impossibles à produire, trop sensibles pour être partagées, marginales dans un environnement sidéré par sa propre complexité, les données de l’éducation ont été cependant en 2021 un sujet porté par la politique gouvernementale. Selon un site du MESRI (enseignement supérieur, recherche et innovation) « Ouvrir la science », « Le potentiel des données d’enseignement supérieur et de recherche, ainsi que des données administratives et de pilotage de l’enseignement supérieur, de la recherche et de l’innovation est encore trop peu exploité, malgré les efforts déjà engagés. Pourtant, une meilleure gestion des données permettrait un gain important de valeur scientifique, économique et d’efficacité collective ». Du côté du MENJS ( éducation nationale, jeunesse et sports), le rapport du comité d’éthique des données de l’éducation précise : « Le secteur du numérique éducatif ouvre un nouveau champ des possibles pédagogiques par le recueil, l’analyse et l’exploitation des données d’éducation. Ces potentialités nouvelles doivent d’abord être au bénéfice des élèves et de leurs familles, des professeurs, des chercheurs en éducation mais doivent aussi éclairer le pilotage du système éducatif. »

Si la donnée ouverte est l’objet d’une politique numérique des deux ministères concernés (selon l’organisation actuelle du gouvernement, MESRI et MENJS), il apparaît que ces deux ministères qui réunissent plus de 12 millions d’usagers, en comptant les seuls élèves et étudiants, indépendamment des familles, et plus d’un million d’enseignants, ont relativement peu de jeux de données ouverts, au regard de leur puissance statistique. De plus ces jeux sont ponctuels, aléatoires et discontinus (analyse de data.gouv, rubrique éducation). Ils ne permettent pas d’évaluation systématique et participative du service public de l’éducation en France. Par ailleurs ces deux ministères ont de solides services statistiques qui publient de nombreuses études, à partir de données traitées et agrégées sans pour autant partager les jeux de données.

L’hypothèse examinée est purement potentielle : l’ouverture méthodique de données descriptives du système éducatif aurait-elle un effet sur l’appropriation de l’éducation comme bien commun par la communauté sociale ? En somme la critique de l’éducation par les médias, les politiques et les usagers pourrait-elle évoluer si les données décrivant le service public exprimaient une redevabilité et une transparence du service public de l’éducation ?
Si les deux ministères, en particulier le MENJS, qui se distingue au sein des autres ministères par le niveau de contrôle exercé par le cabinet sur les données publiées, et par un haut degré de définition des « données sensibles », augmentaient le flux et la complémentarité des données publiées, à quelles conditions cela pourrait-il améliorer la reconnaissance par des communautés (éducatives, informatiques, associatives) de la qualité du système éducatif et de sa valeur pour le pays ?
L’hypothèse peut paraître anecdotique et difficile à examiner. Elle permet cependant d’expliciter les thèses sous-jacentes aux réticences, difficultés ou au contraire investissement de l’open data et de passer en revue les appels actuels à leur ouverture. Considérons qu’elle permet aussi d’évaluer avec quelques années de recul les thèses développées dans plusieurs travaux sur le rôle des données ouvertes dans les politiques de modernisation de l’Etat français (Goëta, 2016 ; 2017 Denis, 2017, 2020, Auray, 2013 ; Bellon, 2017) , autour de l’idée que l’open data a été un instrument dans ces politiques et a introduit la notion de communs numériques dans le discours d’Etat (Shulz, 2021).
En analysant les occurrences de « données ouvertes » en contexte, il s’agit donc d’examiner si l’éducation occupe une place particulière (par son niveau de fermeture) , éventuellement en contradiction avec l’intérêt que les sujets éducatifs éveillent, et de proposer des explications (organisationnelles, techniques, éthiques). Pour interroger cette possible spécificité, on utilisera différentes sondes :
– Etude (rapide) depuis le point d’origine d’une politique de la donnée ouverte, l’année 2013, avec l’arrivée d’Henri Verdier à la direction d’Etalab, et le développement du site data.gouv, qui seront les bases d’un discours public sur l’open data, et l’innovation publique, par l’ouverture des monopoles informationnels de l’Etat.
– Etude terminologique du vocabulaire désignant les données : comparaison lexique statistique vs lexique data sciences, catégories descriptives (i.e : données de l’apprentissage, données PISA, données personnelles, données éducatives, données de la recherche), telles qu’émanant des textes officiels (circulaires, rapports), de la nomenclature des services et des libellés de poste, des discours des acteurs lors des entretiens.
– Etude comparative « données de l’éducation 2021 vs données de la santé 2019 ». Les données de la santé ont connu un affinement récent, à la suite du rapport Pon (regroupements thématiques, caractérisation accrue, terminologie enrichie, définition des services producteurs, gestionnaires et utilisateurs), mais aussi sous le booster qu’a représenté la pandémie Covid-19 en termes de valorisation sociale des données ouvertes, constituant cellles-ci comme une « cause » d’intérêt général.
– Etudes des textes officiels invitant à lier politiques d’ouverture de la donnée et politiques d’innovation. (Rapport Bothorel, ( 23/12/2020), Circulaire du premier ministre « Données, algorithmes et codes sources »(27 avril 2021), feuilles de route de 15 ministères et nomination d’un ou une administrateur des données dans chaque ministère ( septembre 2021)
Cette proposition est un segment d’un enquête portant sur la politique numérique éducative (octobre janvier 2021), entretiens, analyses de documents et observations, au MESRI et au MENJS, et s’inscrit dans le champ d’une description sociale de la donnée, considérée comme préfigurant les possibilités et impossibilités d’une production technique de la donnée, en relation ou non avec une approche dite data by design.
15h00-15h45 Actualités des données en SIC, Gérald Kembellec. Publier, décrire, partager et valoriser ses données : de nouveaux modes d’écriture en SHS (focales sur le notebook et le datapaper).
http://r.cnam.fr/data-dicen-2022
15h45-16h30
Appel à présentation informelle aux doctorant.es : place des données dans leur projet de thèse avec une présentation de 5 min et 5 à 10 min d’échange avec la salle.
16h30-16h45 – Conclusion, Clôture

Conférence Data and digital humanities

Thématique : Data

La 2ème conférence internationale « Digital Tools and Uses », https://ddh20.sciencesconf.org/ dont le Laboratoire est partenaire, va se tenir en octobre 2020 en Tunisie. Dans ce cadre, Gérald Kembellec organise un Workshop sur les enjeux de la donnée en contexte des humanités numériques. Cet événement est en lien avec la thématique « Data, médiation, valorisation » du Laboratoire, avec des réflexions sur les modèles, les méthodes de traitement des données des humanités : quels sont les particularités disciplinaires, est-il possible et souhaitable de penser cet aspect des humanités de manière interdisciplinaire ?

Les membres du Laboratoire intéressés par le sujet sont invités à se rapprocher de Gérald Kembellec pour toute information complémentaire.

Conférence internationale sur les humanités numériques

TEI et encodage des textes anciens

The digital humanities offer a particularly rich research field of studies for data processing, apart from those of the hard sciences and the social sciences. Indeed, the humanities are rarely subject to privacy principles (privacy by design, GDPR…) that affect most social science works and are not just about digital or binary data. Moreover, in DH the data pre-exist and are most often already known if they are not collected and formalized. In this specific context, we propose in this track to question the practices resulting from the constitution of corpus and uses of data in humanities.

This track is intended to be interdisciplinary to cover various aspects of the humanities that use various models, methods and analyses for the cross-fertilization of knowledge. With regard to the reuse of research-generated data, its implementation is encouraged with developments in open and reproducible science. For example, we propose to analyze links between political and social injunctions to data sharing, the requirements of funding organizations and the reality of Humanities issues. We also wish to discuss methods of controlling the quality of the data whether they are “captured” (i.e. Drucker’s “capta”) or “produced” as well as the possibility of “linking” them with each other and with authoritative organisms, vocabularies, and description schemes.

So, what will be the new uses of research data to consider in Humanities? When and how to prepare to share the data produced? Finally, what are the pitfalls to avoid?

Main topics :

Contributions may address one or more of the following topics

Visualization of humanities data for the answer to scientific questions (questions of ethics, graphic semiology …).
Mathematics and humanities (statistics, clustering …).
Natural Language Processing (NLP) and the humanities.
Emergence of research questions in humanities through digital methods.
Cartography and the humanities.
Data identified and linked in humanities (LOD).
Methodology and modeling in digital humanities: the importance of maieutic (Socratic method).
Practices of sharing data from digital humanities.
Multidisciplinary point of view dealing with humanities’ data: Methodological and epistemic negotiations.

Scientific Committee

Kmar BENDANA, University of la Manouba, Tunisia
Frédéric CLAVERT, University of Luxembourg, Luxembourg, Luxembourg
Marija DALBELLO, Rutgers School of Information and Communication, United States
Frédéric DARBELLAY, University of Genève, Switzerland
Martin GRANDJEAN, University of Lausanne, Switzerland
Olivier LE DEUFF, University of Bordeaux-Montaigne, France
Ingrid MAYEUR, University of Liège, Belgium
Xavier-Laurent SALVADOR, University of Villetaneuse, France
René SCHNEIDER, HEG-SO, Genève, Switzerland
Dominique TRUDEL, UQAC, Canada
Marcello VITALI-ROSATI, University of Montréal, Canada
Eveline WANDL-VOGT, Austrian Academy of Sciences, Austria

Bibliography

Abiteboul, S., & Dowek, G. (2017). Le temps des algorithmes. Le pommier.
Bailey, C. D. (2014). Psychopathy, Academic Accountants’ Attitudes toward Unethical Research Practices, and Publication Success. The Accounting Review, 90(4), 1307‑1332. https://doi.org/10.2308/accr-50970
Bertin, J (1967) Sémiologie Graphique. Les diagrammes, les réseaux, les cartes. With MarcBarbut [et al.]. Paris: Gauthier-Villars. (Translation 1983. Semiology of Graphics by William J. Berg).
Borgman, C. L. (2010). The digital future is now: A call to action for the humanities.
Busa, R. (1974). Index Thomisticus Sancti Thomae Aquinatis Operum Omnium Indices Et Concordantiae in Quibus Verborum Omnium Et Singulorum Formae Et Lemmata Cum Suis Frequentiis Et Contextibus Variis Modis Referuntur.
Busa, R. (1980). The annals of humanities computing: The index thomisticus. Computers and the Humanities, 14(2), 83–90.
Cardon, D. (2015). A quoi rêvent les algorithmes. Nos vies à l’heure du Big Data. Paris: Le Seuil.
Castets-Renard, C., & Gandon, N. (2016). Open data des données de la recherche publique : entre réformes législatives et retour d’expérience sur un guide pratique à destination des chercheurs. LEGICOM, N° 56(1), 67‑75.
Drucker, J. (2011). Humanities approaches to graphical display. Digital Humanities Quarterly, 5(1), 1–21.
Gandon, F., Sabou, M., & Sack, H. (2017). Weaving a Web of linked resources. Semantic Web, 8(6), 767-772.
Gingras, Y. (2018). Les transformations de la production du savoir : de l’unité de connaissance à l’unité comptable. Zilsel, 4(2), 139‑152.
Kaplan, F. (2015). A map for big data research in digital humanities. Frontiers in digital humanities, 2(1).
Kembellec, G., & Broudoux, E. (Eds.). (2017). Reading and Writing Knowledge in Scientific Communities: Digital Humanities and Knowledge Construction. John Wiley & Sons.
Lemercier, C., & Zalc, C. (2019). Quantitative Methods in the Humanities: An Introduction. University of Virginia Press.
McCarty, W. (2016). Collaborative research in the digital humanities. In Collaborative Research in the Digital Humanities (pp. 13-22). Routledge.
Molloy, J. C. (2011). The open knowledge foundation: open data means better science. PLoS biology, 9(12), e1001195.
Schöch, C. (2013). Big? smart? clean? messy? Data in the humanities. Journal of digital humanities, 2(3), 2-13.

Les actes de la conférence seront publiés et largement diffusés via la plateforme éditoriale de la société savante ACM.

ACM International Conference Proceedings Series

Programme de la demi-journée du 27 mars de séminaire Dicen pour la Thématique « Data, médiation, valorisation »

Thématique : Data

Au Conservatoire National des Arts et Métiers
292 Rue Saint-Martin
75003 Paris
Salle 17.2.14, de 13h30 à 17h30.

Graphe des acteurs et sujets du séminaire

13h30 – Session 1 : Les données de la recherche, problématiques de production et d’usage (modératrice : Camille Claverie)

– 13h30 – Gérald Kembellec :

Quelques rappels sur les questions institutionnelles liées à la collecte, la l’analyse, la transformation et le partage des données de la recherche. (10 minutes de présentation et 5 de discussion) ;

– 13h45 – Joumana Boustany :

Nous présentera les résultats de son enquête sur les données de la recherche ; (entre 20 et 25 minutes de présentation et 10 de discussion) ;

– 14h25 – Olivier Champalle :

Les traces numériques comme objet de connaissances. Quels moyens pour : l’analyse de traces, la capitalisation et l’extraction automatique des connaissances sur le terrain des learning analytics (entre 20 et 25 minutes de présentation et 10 de discussion) ;

15h15 – Pause

15h30 Session 2 – Autorité de la donnée, les algorithmes au service de la gouvernance, de l’influence et du marketing (modératrice : Béa Arruabarréna)

– 15h30 – Karim Fraoua :

La datascience appliquée au domaine du marketing : la décision aidée par les données (20 et 25 minutes de présentation et 10 de discussion) ;

– 16h10 – Lucile Desmoulins, Camille Alloing (IAE de Poitiers) et Vanessa Mohli (Les Bornées Digital Company) :

Une analyse de l’imbrication entre influence et donnée(s) : Médiations et négociations dans les agences de communication « influenceurs » (20 et 25 minutes de présentation et 10 de discussion) ;

– 16h50 – Maryse Carmes :

L’instauration de l’algorithmie dans l’action publique (20 et 25 minutes de présentation et 10 de discussion) ;

17h30 précise – Clôture

Inscription à DTU

Programme

Programme de la conférence

A propos

Les inscriptions sont ourvertes ici (gratuit).
Le premier congrès international Digital Tools & Uses est une conférence multidisciplinaire internationale consacrée à l’étude des usages et du développement des outils numériques.
Sur Twitter : #dtucparis

Il vise à réunir 4 symposiums interdépendants:

1) les études sur le Web (digital studies),
2) les défis de l’IoT (IoT challenges),
3) les systèmes de recommandation (Interdisciplinary Workshop on Recommender Systems aka InWoRS’2018),
4) les archives, bibliothèques et les réseaux sociaux (International conference on Libraries and Archives in the Digital Humanities Era aka CIBAHN’2018), et

L’intention de ce congrès est d’aborder un objet d’étude commun à partir de différentes perspectives afin d’enrichir la discussion et la collaboration entre les participants.

Chacun des congrès susmentionnés a déjà eu lieu séparément les années passées. L’objectif est maintenant de consolider les relations qui rassemblent la théorie et la pratique, les techniques et les humanités, les agents humains et artificiels, les sciences et les arts. Les chercheurs et les praticiens se réuniront et apprendront les uns des autres dans un environnement accueillant, gommant les frontières entre les disciplines et les écoles.

Pour cette raison, chacun des cinq symposiums indépendants est présenté ci-dessous comme une axe du Congrès Digital Tools & Uses et aura lieu simultanément pendant les trois jours du congrès.

Nous sommes reconnaissants envers les partenaires exceptionnels et les collègues internationaux qui ont accepté de nous accompagner dans cette entreprise. Nous nous attendons à ce que cette première édition du Digital Tools & Uses Congress offre une grande variété d’idées et de développements scientifiques à l’intersection des STM et des Sciences humaines.

Publication

Programme de la conférence

Une sélection des meilleurs articles seront invités à publier des versions étendues sous la forme de chapitres de livres sous la série Digital Tools & Uses à ISTE & Wiley (index par http://onlinelibrary.wiley.com/).

Il est à noter que le laboratoire Dicen-IdF est étroitement associé à l’organisation et à la tenue globale du congrès et plus particulièrement aux thématiques Libraries and Archives in the Digital Humanities Era et Interdisciplinary Workshop on Recommender Systems

La version anglaise d’ « écrilecture scientifique » est publiée

Thématiques : Data — sponsable de la thématique

http://eu.wiley.com/WileyCDA/WileyTitle/productCd-1786301253.html

Couverture de la version anglaise de l’ouvrage coordonné par Évelyne Broudoux et Gérald Kembellec sur l’Ecrilecture scientifique

Ce livre est introduit par Manuel Zacklad. Vous y retrouverez des chapitres de collègues du Dicen : Thomas Bottini, Évelyne Broudoux et Gérald Kembellec, Lisa Chupin, Camille Claverie et Annaïg Mahé.

Livre Ecrilecture augmentée dans les communautés scientifiques

Thématique : Data

Ecrilecture augmentée dans les communautés scientifiques

Humanités numériques et construction des savoirs

Février 2017, ISTE éditions, Londres
ISSN : 978-1-78405-220-1
eISNN : 978-1-78405-220-0

Résumé

Les pratiques liées aux usages de lecture « savante » se sont perpétuées au cours des siècles et les annotations sont elles-mêmes devenues objets d’études, comme plus-values des textes originaux et documents. Historiquement reconnues depuis le XIIe siècle, les premières techniques de lecture dites « savantes » réunissaient la lecture et l’écriture dans un processus de lettrure, mêlant lecture attentive et commentaire. Le web a transformé cette activité par l’ajout de couches techniques concernant à la fois les processus d’écriture et de lecture, mais aussi la circulation des textes, leur augmentation potentielle et réalisée, leur diffusion et leur réception.
Cet ouvrage a pour objectif d’examiner à l’heure de l’écrilecture informatisée les conditions matérielles de co-construction des savoirs scientifiques et leur augmentation. Sont donc présentés ici des études et retours d’expérience concernant les processus intellectuels instrumentés, les espaces de critique ouverts, l’édition savante collaborative, les modalités de circulation et de médiatisation des savoirs, les techniques élaborées et les outils employés.

Couverture de l’ouvrage « Ecrilecture augmentée dans les communautés scientifiques »

Coordonnateurs :

(afficher/cacher)

Evelyne BROUDOUX
Dicen-IdF
CNAM
LabEx HASTEC (ANR‐10‐LABX‐85)
Paris

Gérald KEMBELLEC
CNAM
Dicen-IdF
LabEx HASTEC (ANR‐10‐LABX‐85)
Paris

Auteurs :

(afficher/cacher)

Francesco BERETTA
Pôle Histoire numérique, Larha-CNRS UMR5190
CNRS
Lyon

Thomas BOTTINI
Dicen-IdF
CNAM
Paris

Evelyne BROUDOUX
Dicen-IdF
CNAM
LabEx HASTEC (ANR‐10‐LABX‐85)
Paris

Lisa CHUPIN
Dicen-IdF
CNAM
Paris

Camille CLAVERIE
Dicen-IdF
Université Paris-Ouest
Nanterre

Viviane CLAVIER
Gresec
Université Grenoble-Alpes
Grenoble

Hans DILLAERTS
Ceric-Lerass
Université de Montpellier 3
Montpellier

Marc JAHJAH
Cresat
Université de Haute-Alsace
Mulhouse

Gérald KEMBELLEC
CNAM
Dicen-IdF
LabEx HASTEC (ANR‐10‐LABX‐85)
Paris

Rosemonde LETRICOT
Larha-CNRS UMR5190
Université Jean Moulin Lyon 3
Lyon

Annaïg MAHÉ
URFIST de Paris
Université Paris-Sorbonne
Dicen-IdF
Paris

Céline PAGANELLI
Université de Montpellier 3
Ceric-Lerass
Montpellier

Lise VERLAET
Université de Montpellier 3
Ceric-Lerass
Montpellier

Manuel ZACKLAD
CNAM
Dicen-IdF
Paris

La communication Humains-données.

Argumentaire

Trois tensions structurent notre réflexion.

1. Transparence et opacité

2. Personnalisation et normativité

3. Agentivité et délégation

Détail des présentations

Conférence Keynote donnée par Ann Blair (univ. Harvard), « The Role of People in Managing Information, Past and Present » le 21.05.2025à 18h00 à l’Institut Historique Allemand

Dans le cadre de la journée d’étude coorganisée par le Dicen-IdF en partenariat avec l’IHA «Mise en données du fait historique. Enjeux, méthodes et modélisations» (programme).

Organisation : Gérald Kembellec (CNAM), Pauline Spychala (IHA)

Journée d’étude de la thématique « Data, médiation, valorisation »

Modalité de participation

Programme prévisionnel du séminaire

Matin – Data et usages : Dimensions philosophique / anthropologique et techniques

Après midi – Data et usages : Dimensions éducatives et data literacy

Conférence internationale sur les humanités numériques

Main topics :

Contributions may address one or more of the following topics

Scientific Committee

Bibliography

Programme

A propos

Publication

Ecrilecture augmentée dans les communautés scientifiques

Humanités numériques et construction des savoirs

Résumé

Coordonnateurs :

Auteurs :

Organisation :
Gérald Kembellec (CNAM), Pauline Spychala (IHA)

Journée d’étude de la thématique
« Data, médiation, valorisation »