Archives de l’auteur : Gérald Kembellec

Séminaire Data, médiation, valorisation

Thématiques : Datasponsable de la thématique

Journée d’étude de la thématique
« Data, médiation, valorisation »

Le 15 avril à partir de 10h – Amphi Jean Prouvé (Côté saint Martin, accès 11, r-ch) au Cnam
Co-animée par Béa Arruabarrena, Gérald Kembellec et Karim Fraoua (poster une déclaration d’intention ou poser une question)

–> PROGRAMME <–



« Place des données dans les sciences de l’information et de la communication : usages, usagers et applications » (clickez pour afficher/cacher la suite de l’appel)

La journée d’études spéciale « data, médiation, valorisation » du Laboratoire DICEN-IdF se tiendra le 15 avril prochain au CNAM. Nous y discuterons les phénomènes data sous plusieurs angles disciplinaires : Info-communicationnel comme axe d’ancrage bien sûr, mais aussi en convoquant des postures issues notamment de l’anthropologie, de la sociologie ou même de la philosophie. L’objectif de cette journée d’étude est faire un état des travaux de recherche interne au Laboratoire DICEN-IdF sur le phénomène des datas par leurs contributions épistémologiques, méthodologiques et appliquées s’intéressent aux problématiques de data dans leurs rapports entre humains et société au regard des enjeux sociotechniques, sociocognitifs, organisationnels, socioéconomiques, politiques et éthiques qu’elles soulèvent.

A l’heure où la mise en données des activités humaines par n’a jamais été aussi importante, les technologies numériques produisent des données de manière de plus en plus massive, qui elles obligent à repenser les relations humaines, le fonctionnement de la société et les modalités de la production de nouveaux savoirs appuyés sur les contenus. Ces avancées majeures impactent nos réflexions sur la relation humaine au sens de l’interface humain-machine que ce soit par l’extension technologique de l’IOT (et des objets connectés), l’émergence de l’intelligence artificielle, le Web sémantique, le traitement des données massives, mettant en œuvre des algorithmes et des méthodes d’analyse quantitative de données de plus en plus sophistiqués, telles que le Machine Learning pour la prédiction et le Deep Learning pour la reconnaissance faciale ou encore le traitement automatique des langues avec par exemple. Toutes ces évolutions technologiques ont un impact d’ordre cognitif et anthropologique non seulement dans leur conception (design) basés sur les ressorts de la psychologie cognitive et sociale, et les récentes découvertes des neurosciences que dans leurs usages où les dispositifs data interviennent désormais dans toutes nos décisions. Ces innovations technologiques occasionnent également le développement de nouvelles formes de « gouvernementalité » pour la société, telles qu’on peut le voir avec l’utilisation des traces comportementales, ou encore avec l’intensification de plateforme de données, des API et l’automatisation des procédures portés par l’action publique par exemple. La question de l’impact de la donnée est aussi cruciale sur la production de savoir pour les recherches en sciences sociales. Ce sont aussi les questionnements éthiques tant sur le plan de la protection des données que celui de la protection des personnes qui sont convoqués.

Ce séminaire sera organisé en deux parties. Dans une première partie, il s’agira d’aborder les travaux d’ordre théorique et méthodologique visant à problématiser d’un point de vue disciplinaire, la médiation et de la valorisation des données et les enjeux associés au sein de notre société. Nous questionnerons alors la manière dont on peut analyser les dispositifs producteurs ou consommateurs de données comme « objets frontières » entre les disciplines et quelle est la porosité des dites frontières sur ces sujets. Dans la deuxième partie, nous explorerons les aspects applicatifs (expérimentation, cas d’usages, etc.) qui questionnent, mettent en œuvre ou soulèvent des problématiques de données pour la société, dans des domaines aussi variés que la santé, l’éducation, la ville, l’écologie, le marketing et la documentation, etc.

Modalité de participation

Les contributions peuvent couvrir différents champs sur ce qui a été exposé, il faut proposer pour le 15janvier février 2022 un résumé d’une page maximum adressée à Gérald Kembellec, Karim Fraoua et Béatrice Arruabarrena (avec une courte bibliographie en cas d’intervention extérieure au laboratoire, sur proposition d’un membre du Laboratoire). Il faudra préciser dans le courriel si vous souhaitez participer sur la partie « théorique » ou dans la partie « appliquée » de l’après-midi, ou encore s’il s’agit de discuter un texte lors de la section doctorale.

JE 2020 Data, médiation, valorisation
Chaque présentation durera environ 20-15 minutes et sera suivie d’échanges avec les participants.
Les propositions des doctorants sont encouragées, surtout s’il y a un enjeu de présentation scientifique ultérieure lors d’un congrès (comme H2PTM, SFSIC…) ou encore du séminaire doctoral. Une session est spécifiquement dédiée en fin de journée à la discussion des textes de doctorants.

Programme prévisionnel du séminaire

Matin – Data et usages : Dimensions philosophique / anthropologique et techniques

  • 10h Introduction : Gérald Kembellec & B. Arruabarrena & K.E Fraoua
  • 10h15-11h00 Intervention théorique 1, Armen Khatchatourov: Deux figures de Big Data. (afficher le résumé)

    En examinant les technologies et les discours à l’œuvre dans Big Data, nous proposons d’y distinguer deux tendances en partie concurrentes qui permettent de décrire les nouveaux « diagrammes » du pouvoir, les modes de gouvernementalité qui leur correspondent, ainsi que leurs relations complexes avec les savoirs constitués.

    On postule aujourd’hui que nos savoirs dépendent de plus en plus des « données » obtenus à l’aide de Big Data. L’approche critique de ce champ, d’abord structurée par des enjeux épistémologiques, thématise la manière dont ce nouveau paradigme redéfinit la constitution des savoirs. Après une brève restitution de ce débat dans le but d’en dégager quelques éléments distinctifs et problématiques, nous allons tenter de le compléter par une approche dont l’aspiration est de dépasser les problèmes strictement épistémologiques pour s’acheminer vers ceux de l’exercice du pouvoir, en amont de la constitution des savoirs particuliers. Pour ce faire, nous tenterons de dégager le diagramme d’aujourd’hui, dans le sens où ce terme est employé par Gilles Deleuze, à savoir une représentation, une exposition « des rapports de force qui constituent le pouvoir ».

    Cette analyse, convoquant également le paradigme cybernétique ici en jeu, nous amène à formuler l’hypothèse suivante : il en va désormais non pas simplement d’une nouvelle forme historique de la relation entre les savoirs et le pouvoir mais de l’auto-actualisation indéfinie de ce dernier.

  • 11h00-11h45 Intervention théorique 2, Dario Compagno. Au-delà des big data : pour une approche model based aux données des SHS (afficher le résumé)

    Les dernières années ont vu une explosion de recherches basées sur des algorithmes
    capables d’extraire de l’information de manière purement inductive à partir de grandes
    bases de données. Ces approches permettent par exemple de réaliser des annotations en
    imitant l’agir humain (algorithmes supervisés) et même de détecter des formes invisibles à
    l’œil humain, c’est-à-dire des nouveaux observables (Rastier), sur la base d’associations
    parmi un grand nombre de petits traits pertinents (algorithmes non-supervisés). Les
    dernières technologies permettent d’intensifier la puissance de ces approches, par exemple
    grâce aux réseaux de neurones, qui identifient eux même les traits les plus pertinents pour
    une certaine tâche, et implémentent donc une approche de plus en plus créative et
    “humaine”. On a dit que grâce aux algorithmes on serait donc entrés dans un quatrième
    paradigme de la recherche scientifique, où les corrélations auraient substituées le recours à
    des modèles interprétatifs formulés à partir de théories, et cela avant de collecter des
    données. Certaines limites des algorithmes inductifs sont connues, et notamment leur
    opacité. Pour cette raison, les chercheurs se concentrent aujourd’hui dans le développement
    d’algorithmes plus facilement interprétables.
    Mais même au net de leurs problèmes d’opacité, les algorithmes inductifs souffrent d’une
    grande incapacité, d’une faiblesse qui dérive directement de la statistique traditionnelle sur
    laquelle ces algorithmes se basent. La statistique classique en effet ne sait pas passer d’une
    corrélation observée dans les données à son interprétation, notamment causale (Fisher). Et
    effectivement les algorithmes inductifs sont juste des puissantes machines à corrélation : ils
    identifient des configurations mais ils ne peuvent pas leur attribuer du sens. Depuis une
    vingtaine d’années, au contraire, une nouvelle famille d’approches se pose la question de
    formaliser les conditions en accord avec lesquelles certaines corrélations peuvent être
    interprétées causalement (Pearl). Cela permet de répondre à des vraies questions
    scientifiques, pour lesquelles des simples configurations de corrélations seraient
    insuffisantes ou pourraient même induire des lectures trompeuses. Les modèles causaux
    sont des dispositifs hypothético-déductifs qui apportent de la connaissance qualitative aux
    données, et permettent d’intégrer le travail des algorithmes (appliqués d’ailleurs souvent à
    des “small” data) dans une vraie perspective de recherche.
    Notre intervention présente ces approches model based, vis-à-vis des algorithmes inductifs,
    et se concentre sur leur applicabilité aux sciences de l’homme. En effet, les modèles
    causaux visent des interprétations causales des données, mais il n’est pas dit que cela soit
    suffisant pour les SHS (Geertz, Eco). Nous proposons donc une extension des méthodes
    causales visant à saisir le sens de données qui sont déjà signifiantes, qui sont déjà des
    signes avec leur intentionnalité (Searle), et pour lesquels une lecture causale ne serait pas
    adéquate.

  • 11h45-12h30, Intervention théorique 3, Karim Fraoua et Amos David. Émergence de la Blockchain dans l’espace numérique, une nouvelle identité partagée.
  • Pause /déjeuner libre
  • Après midi – Data et usages : Dimensions éducatives et data literacy

  • 13h30-14h15 Intervention théorique 4, Ugo Verdi, Resituer la data literacy dans son écosystème littératien (afficher le résumé)

    La donnée, objet conceptuel ayant connu une nouvelle mise en lumière avec l’évocation
    des big data, de l’open data, de l’intelligence articielle et des algorithmes, considérée
    comme le” nouveau pétrôle du XXIe siècle” (Haupt 2016) et comme avantage compétitif
    certain (CNIL and BpiFrance 2018), est l’objet de guerres commerciales et l’enjeu de
    débats citoyens récurrents notamment dans le cadre de l’appropriation des données
    personnelles et des impacts de la datafication. Dans ce contexte, la_ data literacy_ est
    alors souvent vue comme la solution miracle pour la formation de “lettrés de la donnée”
    (data literate). Or, si cette nécessité d’une maitrise des données est constamment
    évoquée, réaffirmée avec la crise de la Covid-19 (Commission Européenne 2020), nous
    constatons toutefois un manque de clarté sur l’ancrage de la_ data literacy_ dans un
    écosystème littératien complexe et profifique; la data literacy elle-même ayant connu et
    continuant de connaitre des évolutions.
    L’héritage de la data literacy est double, ancrée d’une part dans l’histoire de la donnée,
    et ancrée d’autre part dans la logique de la littératie, à savoir l’étude des effets de la
    lecture et l’écriture sur la cognition humaine (Olson and Lejosne 2006), remise en
    lumière par les travaux de Jack Goody. La littératie elle-même est traversée de plusieurs
    courants, que Sreet nomme “autonome” et “idéologique” (Street 2006) dont les
    implications techniques et culturelles façonnent les visions implémentées dans les
    littératies qui ont pu naitre par la suite (ex : Information Literacy, Data Literacy, etc.).
    Et par-delà la littératie elle-même, la data literacy est imbriquée dans un écosystème de
    littératies, dont le nombre total ne peut être quantifié notamment du fait que les
    frontières entre elles sont de plus en plus floues (Le Deuff 2012). Toutefois, plusieurs
    partagent une même appétence pour les données et en font leur matériau d’étude pour
    leurs analyses. Il est à souligner que plusieurs littératies ont précédé la data literacy
    dans l’étude des données et existent toujours actuellement. Du fait de leur ancrage,
    elles influencent la vision des données et in extenso de la data literacy, en particulier la
    statistical literacy (Shields 2005). De fait, la place de la data literacy, ses interactions vis-
    à-vis des autres littératies, tend à l’instabilité, les visions de sa nature divergeant selon
    les auteurs.
    Et si nous parlons ici de la data literacy sous l’angle d’une littératie monolotique, aux
    définitions et compétences bien arrêtées (dont les auteurs les plus connus ayant
    travaillé sur cette thématique sont notamment (Gummer and Mandinach 2015) et (Prado
    and Marzal 2013)), c’est parce qu’elle a constitué une remise en cause ayant abouti à la
    crétion de nombreuses data literacies spécialisées dans un domaine spécifique (ex : la
    pedogical data literacy (Mandinach 2012)), des compétences spécifiques (ex : la data
    visualisation literacy (Börner, Bueckle, and Ginda 2019)) ou encore des données
    spécifiques (ex : la big data literacy (Bhargava 2015)),. Les raisons évoquées sont
    multiples : manque de compétences spécifiques, nécessité d’une extension du domaine
    d’analyse ou encore dénomination inadéquate.
    Ainsi, l’objectif de cette contribution est d’apporter un éclairage épistémologique de la
    data literacy en rappelant héritage littératien de la data literacy, en analysant ses
    interactions avec les littératies voisines et enfin en traitant ses diverses spécialisations.

  • 14h15-15h00 Intervention théorique 5, Sophie Pène. Indisponibles données : Les belles endormies de l’éducation (afficher le résumé)

    La proposition porte sur les données de l’éducation. Elle vise à décrire l’état de maturité de la « donnée » (2021), et plus précisément de l’open data, dans les discours professionnels de l’administration centrale de l’éducation et de la recherche. Impossibles à produire, trop sensibles pour être partagées, marginales dans un environnement sidéré par sa propre complexité, les données de l’éducation ont été cependant en 2021 un sujet porté par la politique gouvernementale. Selon un site du MESRI (enseignement supérieur, recherche et innovation) « Ouvrir la science », « Le potentiel des données d’enseignement supérieur et de recherche, ainsi que des données administratives et de pilotage de l’enseignement supérieur, de la recherche et de l’innovation est encore trop peu exploité, malgré les efforts déjà engagés. Pourtant, une meilleure gestion des données permettrait un gain important de valeur scientifique, économique et d’efficacité collective ». Du côté du MENJS ( éducation nationale, jeunesse et sports), le rapport du comité d’éthique des données de l’éducation précise : « Le secteur du numérique éducatif ouvre un nouveau champ des possibles pédagogiques par le recueil, l’analyse et l’exploitation des données d’éducation. Ces potentialités nouvelles doivent d’abord être au bénéfice des élèves et de leurs familles, des professeurs, des chercheurs en éducation mais doivent aussi éclairer le pilotage du système éducatif. »

    Si la donnée ouverte est l’objet d’une politique numérique des deux ministères concernés (selon l’organisation actuelle du gouvernement, MESRI et MENJS), il apparaît que ces deux ministères qui réunissent plus de 12 millions d’usagers, en comptant les seuls élèves et étudiants, indépendamment des familles, et plus d’un million d’enseignants, ont relativement peu de jeux de données ouverts, au regard de leur puissance statistique. De plus ces jeux sont ponctuels, aléatoires et discontinus (analyse de data.gouv, rubrique éducation). Ils ne permettent pas d’évaluation systématique et participative du service public de l’éducation en France. Par ailleurs ces deux ministères ont de solides services statistiques qui publient de nombreuses études, à partir de données traitées et agrégées sans pour autant partager les jeux de données.

    L’hypothèse examinée est purement potentielle : l’ouverture méthodique de données descriptives du système éducatif aurait-elle un effet sur l’appropriation de l’éducation comme bien commun par la communauté sociale ? En somme la critique de l’éducation par les médias, les politiques et les usagers pourrait-elle évoluer si les données décrivant le service public exprimaient une redevabilité et une transparence du service public de l’éducation ?
    Si les deux ministères, en particulier le MENJS, qui se distingue au sein des autres ministères par le niveau de contrôle exercé par le cabinet sur les données publiées, et par un haut degré de définition des « données sensibles », augmentaient le flux et la complémentarité des données publiées, à quelles conditions cela pourrait-il améliorer la reconnaissance par des communautés (éducatives, informatiques, associatives) de la qualité du système éducatif et de sa valeur pour le pays ?
    L’hypothèse peut paraître anecdotique et difficile à examiner. Elle permet cependant d’expliciter les thèses sous-jacentes aux réticences, difficultés ou au contraire investissement de l’open data et de passer en revue les appels actuels à leur ouverture. Considérons qu’elle permet aussi d’évaluer avec quelques années de recul les thèses développées dans plusieurs travaux sur le rôle des données ouvertes dans les politiques de modernisation de l’Etat français (Goëta, 2016 ; 2017 Denis, 2017, 2020, Auray, 2013 ; Bellon, 2017) , autour de l’idée que l’open data a été un instrument dans ces politiques et a introduit la notion de communs numériques dans le discours d’Etat (Shulz, 2021).
    En analysant les occurrences de « données ouvertes » en contexte, il s’agit donc d’examiner si l’éducation occupe une place particulière (par son niveau de fermeture) , éventuellement en contradiction avec l’intérêt que les sujets éducatifs éveillent, et de proposer des explications (organisationnelles, techniques, éthiques). Pour interroger cette possible spécificité, on utilisera différentes sondes :
    – Etude (rapide) depuis le point d’origine d’une politique de la donnée ouverte, l’année 2013, avec l’arrivée d’Henri Verdier à la direction d’Etalab, et le développement du site data.gouv, qui seront les bases d’un discours public sur l’open data, et l’innovation publique, par l’ouverture des monopoles informationnels de l’Etat.
    – Etude terminologique du vocabulaire désignant les données : comparaison lexique statistique vs lexique data sciences, catégories descriptives (i.e : données de l’apprentissage, données PISA, données personnelles, données éducatives, données de la recherche), telles qu’émanant des textes officiels (circulaires, rapports), de la nomenclature des services et des libellés de poste, des discours des acteurs lors des entretiens.
    – Etude comparative « données de l’éducation 2021 vs données de la santé 2019 ». Les données de la santé ont connu un affinement récent, à la suite du rapport Pon (regroupements thématiques, caractérisation accrue, terminologie enrichie, définition des services producteurs, gestionnaires et utilisateurs), mais aussi sous le booster qu’a représenté la pandémie Covid-19 en termes de valorisation sociale des données ouvertes, constituant cellles-ci comme une « cause » d’intérêt général.
    – Etudes des textes officiels invitant à lier politiques d’ouverture de la donnée et politiques d’innovation. (Rapport Bothorel, ( 23/12/2020), Circulaire du premier ministre « Données, algorithmes et codes sources »(27 avril 2021), feuilles de route de 15 ministères et nomination d’un ou une administrateur des données dans chaque ministère ( septembre 2021)
    Cette proposition est un segment d’un enquête portant sur la politique numérique éducative (octobre janvier 2021), entretiens, analyses de documents et observations, au MESRI et au MENJS, et s’inscrit dans le champ d’une description sociale de la donnée, considérée comme préfigurant les possibilités et impossibilités d’une production technique de la donnée, en relation ou non avec une approche dite data by design.

  • 15h00-15h45 Actualités des données en SIC, Gérald Kembellec. Publier, décrire, partager et valoriser ses données : de nouveaux modes d’écriture en SHS (focales sur le notebook et le datapaper).
    http://r.cnam.fr/data-dicen-2022
  • 15h45-16h30
    Appel à présentation informelle aux doctorant.es : place des données dans leur projet de thèse avec une présentation de 5 min et 5 à 10 min d’échange avec la salle.
  • 16h30-16h45 – Conclusion, Clôture

Conférence Data and digital humanities

Thématique : Data

La 2ème conférence internationale « Digital Tools and Uses », https://ddh20.sciencesconf.org/ dont le Laboratoire est partenaire, va se tenir en octobre 2020 en Tunisie. Dans ce cadre, Gérald Kembellec organise un Workshop sur les enjeux de la donnée en contexte des humanités numériques. Cet événement est en lien avec la thématique « Data, médiation, valorisation » du Laboratoire, avec des réflexions sur les modèles, les méthodes de traitement des données des humanités : quels sont les particularités disciplinaires, est-il possible et souhaitable de penser cet aspect des humanités de manière interdisciplinaire ?

Les membres du Laboratoire intéressés par le sujet sont invités à se rapprocher de Gérald Kembellec pour toute information complémentaire.

Conférence internationale sur les humanités numériques

Humanités numériques

TEI et encodage des textes anciens

The digital humanities offer a particularly rich research field of studies for data processing, apart from those of the hard sciences and the social sciences. Indeed, the humanities are rarely subject to privacy principles (privacy by design, GDPR…) that affect most social science works and are not just about digital or binary data. Moreover, in DH the data pre-exist and are most often already known if they are not collected and formalized. In this specific context, we propose in this track to question the practices resulting from the constitution of corpus and uses of data in humanities.

This track is intended to be interdisciplinary to cover various aspects of the humanities that use various models, methods and analyses for the cross-fertilization of knowledge. With regard to the reuse of research-generated data, its implementation is encouraged with developments in open and reproducible science. For example, we propose to analyze links between political and social injunctions to data sharing, the requirements of funding organizations and the reality of Humanities issues. We also wish to discuss methods of controlling the quality of the data whether they are “captured” (i.e. Drucker’s “capta”) or “produced” as well as the possibility of “linking” them with each other and with authoritative organisms, vocabularies, and description schemes.

So, what will be the new uses of research data to consider in Humanities? When and how to prepare to share the data produced? Finally, what are the pitfalls to avoid?

Main topics :

Contributions may address one or more of the following topics

  • Visualization of humanities data for the answer to scientific questions (questions of ethics, graphic semiology …).
  • Mathematics and humanities (statistics, clustering …).
  • Natural Language Processing (NLP) and the humanities.
  • Emergence of research questions in humanities through digital methods.
  • Cartography and the humanities.
  • Data identified and linked in humanities (LOD).
  • Methodology and modeling in digital humanities: the importance of maieutic (Socratic method).
  • Practices of sharing data from digital humanities.
  • Multidisciplinary point of view dealing with humanities’ data: Methodological and epistemic negotiations.

Scientific Committee

  • Kmar BENDANA, University of la Manouba, Tunisia
  • Frédéric CLAVERT, University of Luxembourg, Luxembourg, Luxembourg
  • Marija DALBELLO, Rutgers School of Information and Communication, United States
  • Frédéric DARBELLAY, University of Genève, Switzerland
  • Martin GRANDJEAN, University of Lausanne, Switzerland
  • Olivier LE DEUFF, University of Bordeaux-Montaigne, France
  • Ingrid MAYEUR, University of Liège, Belgium
  • Xavier-Laurent SALVADOR, University of Villetaneuse, France
  • René SCHNEIDER, HEG-SO, Genève, Switzerland
  • Dominique TRUDEL, UQAC, Canada
  • Marcello VITALI-ROSATI, University of Montréal, Canada
  • Eveline WANDL-VOGT, Austrian Academy of Sciences, Austria

Bibliography

  • Abiteboul, S., & Dowek, G. (2017). Le temps des algorithmes. Le pommier.
  • Bailey, C. D. (2014). Psychopathy, Academic Accountants’ Attitudes toward Unethical Research Practices, and Publication Success. The Accounting Review, 90(4), 1307‑1332. https://doi.org/10.2308/accr-50970
  • Bertin, J (1967) Sémiologie Graphique. Les diagrammes, les réseaux, les cartes. With MarcBarbut [et al.]. Paris: Gauthier-Villars. (Translation 1983. Semiology of Graphics by William J. Berg).
  • Borgman, C. L. (2010). The digital future is now: A call to action for the humanities.
  • Busa, R. (1974). Index Thomisticus Sancti Thomae Aquinatis Operum Omnium Indices Et Concordantiae in Quibus Verborum Omnium Et Singulorum Formae Et Lemmata Cum Suis Frequentiis Et Contextibus Variis Modis Referuntur.
  • Busa, R. (1980). The annals of humanities computing: The index thomisticus. Computers and the Humanities, 14(2), 83–90.
  • Cardon, D. (2015). A quoi rêvent les algorithmes. Nos vies à l’heure du Big Data. Paris: Le Seuil.
  • Castets-Renard, C., & Gandon, N. (2016). Open data des données de la recherche publique : entre réformes législatives et retour d’expérience sur un guide pratique à destination des chercheurs. LEGICOM, N° 56(1), 67‑75.
  • Drucker, J. (2011). Humanities approaches to graphical display. Digital Humanities Quarterly, 5(1), 1–21.
  • Gandon, F., Sabou, M., & Sack, H. (2017). Weaving a Web of linked resources. Semantic Web, 8(6), 767-772.
  • Gingras, Y. (2018). Les transformations de la production du savoir : de l’unité de connaissance à l’unité comptable. Zilsel, 4(2), 139‑152.
  • Kaplan, F. (2015). A map for big data research in digital humanities. Frontiers in digital humanities, 2(1).
  • Kembellec, G., & Broudoux, E. (Eds.). (2017). Reading and Writing Knowledge in Scientific Communities: Digital Humanities and Knowledge Construction. John Wiley & Sons.
  • Lemercier, C., & Zalc, C. (2019). Quantitative Methods in the Humanities: An Introduction. University of Virginia Press.
  • McCarty, W. (2016). Collaborative research in the digital humanities. In Collaborative Research in the Digital Humanities (pp. 13-22). Routledge.
  • Molloy, J. C. (2011). The open knowledge foundation: open data means better science. PLoS biology, 9(12), e1001195.
  • Schöch, C. (2013). Big? smart? clean? messy? Data in the humanities. Journal of digital humanities, 2(3), 2-13.

Les actes de la conférence seront publiés et largement diffusés via la plateforme éditoriale de la société savante ACM.

Logo of ACM International Conference Proceedings Series

ACM International Conference Proceedings Series

Programme de la demi-journée du 27 mars de séminaire Dicen pour la Thématique « Data, médiation, valorisation »

Thématique : Data

Au Conservatoire National des Arts et Métiers
292 Rue Saint-Martin
75003 Paris
Salle 17.2.14, de 13h30 à 17h30.

13h30 – Session 1 : Les données de la recherche, problématiques de production et d’usage (modératrice : Camille Claverie)

– 13h30 – Gérald Kembellec :

Quelques rappels sur les questions institutionnelles liées à la collecte, la l’analyse, la transformation et le partage des données de la recherche. (10 minutes de présentation et 5 de discussion) ;

– 13h45 – Joumana Boustany :

Nous présentera les résultats de son enquête sur les données de la recherche ; (entre 20 et 25 minutes de présentation et 10 de discussion) ;

– 14h25 – Olivier Champalle :

Les traces numériques comme objet de connaissances. Quels moyens pour : l’analyse de traces, la capitalisation et l’extraction automatique des connaissances sur le terrain des learning analytics (entre 20 et 25 minutes de présentation et 10 de discussion) ;

15h15 – Pause

15h30 Session 2 – Autorité de la donnée, les algorithmes au service de la gouvernance, de l’influence et du marketing (modératrice : Béa Arruabarréna)

– 15h30 – Karim Fraoua :

La datascience appliquée au domaine du marketing : la décision aidée par les données (20 et 25 minutes de présentation et 10 de discussion) ;

– 16h10 – Lucile Desmoulins, Camille Alloing (IAE de Poitiers) et Vanessa Mohli (Les Bornées Digital Company) :

Une analyse de l’imbrication entre influence et donnée(s) : Médiations et négociations dans les agences de communication « influenceurs » (20 et 25 minutes de présentation et 10 de discussion) ;

– 16h50 – Maryse Carmes :

L’instauration de l’algorithmie dans l’action publique (20 et 25 minutes de présentation et 10 de discussion) ;

17h30 précise – Clôture

Inscription à DTU
Visuel de la conférence

Programme

A propos

Les inscriptions sont ourvertes ici (gratuit).
Le premier congrès international Digital Tools & Uses est une conférence multidisciplinaire internationale consacrée à l’étude des usages et du développement des outils numériques.
Sur Twitter : #dtucparis

Il vise à réunir 4 symposiums interdépendants:

1) les études sur le Web (digital studies),
2) les défis de l’IoT (IoT challenges),
3) les systèmes de recommandation (Interdisciplinary Workshop on Recommender Systems aka InWoRS’2018),
4) les archives, bibliothèques et les réseaux sociaux (International conference on Libraries and Archives in the Digital Humanities Era aka CIBAHN’2018), et

L’intention de ce congrès est d’aborder un objet d’étude commun à partir de différentes perspectives afin d’enrichir la discussion et la collaboration entre les participants.

Chacun des congrès susmentionnés a déjà eu lieu séparément les années passées. L’objectif est maintenant de consolider les relations qui rassemblent la théorie et la pratique, les techniques et les humanités, les agents humains et artificiels, les sciences et les arts. Les chercheurs et les praticiens se réuniront et apprendront les uns des autres dans un environnement accueillant, gommant les frontières entre les disciplines et les écoles.

Pour cette raison, chacun des cinq symposiums indépendants est présenté ci-dessous comme une axe du Congrès Digital Tools & Uses et aura lieu simultanément pendant les trois jours du congrès.

Nous sommes reconnaissants envers les partenaires exceptionnels et les collègues internationaux qui ont accepté de nous accompagner dans cette entreprise. Nous nous attendons à ce que cette première édition du Digital Tools & Uses Congress offre une grande variété d’idées et de développements scientifiques à l’intersection des STM et des Sciences humaines.

Publication

Programme de la conférence

Une sélection des meilleurs articles seront invités à publier des versions étendues sous la forme de chapitres de livres sous la série Digital Tools & Uses à ISTE & Wiley (index par http://onlinelibrary.wiley.com/).

Il est à noter que le laboratoire Dicen-IdF est étroitement associé à l’organisation et à la tenue globale du congrès et plus particulièrement aux thématiques Libraries and Archives in the Digital Humanities Era et Interdisciplinary Workshop on Recommender Systems

La version anglaise d’ « écrilecture scientifique » est publiée

Thématiques : Datasponsable de la thématique

http://eu.wiley.com/WileyCDA/WileyTitle/productCd-1786301253.html

Couverture de la version anglaise de l'ouvrage coordonné par Évelyne Broudoux et Gérald Kembellec sur l'Ecrilecture scientifique

Couverture de la version anglaise de l’ouvrage coordonné par Évelyne Broudoux et Gérald Kembellec sur l’Ecrilecture scientifique


Ce livre est introduit par Manuel Zacklad. Vous y retrouverez des chapitres de collègues du Dicen : Thomas Bottini, Évelyne Broudoux et Gérald Kembellec, Lisa Chupin, Camille Claverie et Annaïg Mahé.

Livre Ecrilecture augmentée dans les communautés scientifiques

Thématique : Data

Ecrilecture augmentée dans les communautés scientifiques

Humanités numériques et construction des savoirs

Février 2017, ISTE éditions, Londres
ISSN : 978-1-78405-220-1
eISNN : 978-1-78405-220-0

Résumé

Les pratiques liées aux usages de lecture « savante » se sont perpétuées au cours des siècles et les annotations sont elles-mêmes devenues objets d’études, comme plus-values des textes originaux et documents. Historiquement reconnues depuis le XIIe siècle, les premières techniques de lecture dites « savantes » réunissaient la lecture et l’écriture dans un processus de lettrure, mêlant lecture attentive et commentaire. Le web a transformé cette activité par l’ajout de couches techniques concernant à la fois les processus d’écriture et de lecture, mais aussi la circulation des textes, leur augmentation potentielle et réalisée, leur diffusion et leur réception.
Cet ouvrage a pour objectif d’examiner à l’heure de l’écrilecture informatisée les conditions matérielles de co-construction des savoirs scientifiques et leur augmentation. Sont donc présentés ici des études et retours d’expérience concernant les processus intellectuels instrumentés, les espaces de critique ouverts, l’édition savante collaborative, les modalités de circulation et de médiatisation des savoirs, les techniques élaborées et les outils employés.

Couverture de l'ouvrage "Ecrilecture augmentée dans les communautés scientifiques"

Couverture de l’ouvrage « Ecrilecture augmentée dans les communautés scientifiques »

Coordonnateurs :

(afficher/cacher)

Evelyne BROUDOUX
Dicen-IdF
CNAM
LabEx HASTEC (ANR‐10‐LABX‐85)
Paris

Gérald KEMBELLEC
CNAM
Dicen-IdF
LabEx HASTEC (ANR‐10‐LABX‐85)
Paris

Auteurs :

(afficher/cacher)

Francesco BERETTA
Pôle Histoire numérique, Larha-CNRS UMR5190
CNRS
Lyon

Thomas BOTTINI
Dicen-IdF
CNAM
Paris

Evelyne BROUDOUX
Dicen-IdF
CNAM
LabEx HASTEC (ANR‐10‐LABX‐85)
Paris

Lisa CHUPIN
Dicen-IdF
CNAM
Paris

Camille CLAVERIE
Dicen-IdF
Université Paris-Ouest
Nanterre

Viviane CLAVIER
Gresec
Université Grenoble-Alpes
Grenoble

Hans DILLAERTS
Ceric-Lerass
Université de Montpellier 3
Montpellier

Marc JAHJAH
Cresat
Université de Haute-Alsace
Mulhouse

Gérald KEMBELLEC
CNAM
Dicen-IdF
LabEx HASTEC (ANR‐10‐LABX‐85)
Paris

Rosemonde LETRICOT
Larha-CNRS UMR5190
Université Jean Moulin Lyon 3
Lyon

Annaïg MAHÉ
URFIST de Paris
Université Paris-Sorbonne
Dicen-IdF
Paris

Céline PAGANELLI
Université de Montpellier 3
Ceric-Lerass
Montpellier

Lise VERLAET
Université de Montpellier 3
Ceric-Lerass
Montpellier

Manuel ZACKLAD
CNAM
Dicen-IdF
Paris

Parution d’un numéro de la revue I2D, avec un dossier thématique sur le Web de données sous la co-direction de Gérald Kembellec et Camille Claverie
pour l’ADBS.

Couverture du numero de juin 2016

DOSSIER. Web de données et création de valeurs : le champ des possibles, Dossier réalisé sous la direction de Camille PRIME-CLAVERIE (Université Paris Ouest Nanterre La Défense) et Gérald KEMBELLEC (Cnam), introduction page(s) 28 à 29

Web de données et création de valeurs : le champ des possibles. Pôle 1 – WEB DE DONNÉES, UN ENJEU POUR LES BIBLIOTHÈQUES, page(s) 30 à 41

Web de données et création de valeurs : le champ des possibles. Pôle 1 – Le web de données en contexte bibliothécaire, Gérald KEMBELLEC, page(s) 30-31

Web de données et création de valeurs : le champ des possibles. Pôle 1 – Comprendre les standards du web de données, Bruno MENON, page(s) 32-34

Web de données et création de valeurs : le champ des possibles. Pôle 1 – De la SDN à la Nuit debout : les métadonnées et les enjeux de gouvernance internationale, Vincent BOULET, page(s) 35-36

Web de données et création de valeurs : le champ des possibles. Pôle 1 – Web de données et bibliothèques : l’évolution du modèle d’agrégation des données, Emmanuelle BERMÈS, page(s) 37

Web de données et création de valeurs : le champ des possibles. Pôle 1 – Démarche et usage de données liées pour le registre ReLIRE, Benjamin DUHAMEL, page(s) 38-39

Web de données et création de valeurs : le champ des possibles. Pôle 1 – Des APIs Istex et Base pour les bibliothèques d’enseignement supérieur de Saint-Étienne, Caroline BRULEY, David VARENNE, page(s) 40-41

Web de données et création de valeurs : le champ des possibles. Pôle 2 – WEB DE DONNÉES, CULTURE ET RECHERCHE, page(s) 42 à 53

Web de données et création de valeurs : le champ des possibles. Pôle 2 – Linked science et web de données, Camille PRIME-CLAVERIE, page(s) 42-43

Web de données et création de valeurs : le champ des possibles. Pôle 2 – Isidore Suggestion, des recommandations de lecture pour les blogs de science, Stéphane POUYLLAU, page(s) 44

Web de données et création de valeurs : le champ des possibles. Pôle 2 – Des textes augmentés avec les données du Web, Thomas FRANCART, page(s) 45

Web de données et création de valeurs : le champ des possibles. Pôle 2 – Le développement du web des données culturelles. Les enjeux pour le ministère de la Culture et de la Communication, Bertrand SAJUS, Marie-Véronique LEROI, page(s) 46-47

Web de données et création de valeurs : le champ des possibles. Pôle 2 – L’enjeu du web de données pour les éditeurs, Jean-Paul JORDA, page(s) 48

Web de données et création de valeurs : le champ des possibles. Pôle 2 – L’enjeu du web de données pour l’édition scientifique, Lise VERLAET, Hans DILLAERTS, page(s) 49

Web de données et création de valeurs : le champ des possibles. Pôle 2 – DBpédia.fr : retour sur la publication de données de la culture française, Fabien GANDON, Raphaël BOYER, Alexandre MONNIN, page(s) 50-51

Web de données et création de valeurs : le champ des possibles. Pôle 2 – Re-Source, une archive en temps réel pour la publication et la production, Alexandre MONNIN, Jérôme DENIS, Nicolas DELAFORGE, page(s) 52-53

Web de données et création de valeurs : le champ des possibles. Pôle 3 – WEB DE DONNÉES, PRATIQUES ET USAGES « MÉTIERS », page(s) 54 à 67

Web de données et création de valeurs : le champ des possibles. Pôle 3 – Du web sémantique au web des données, quels enjeux professionnels ?, Jean CHARLET, Gérald KEMBELLEC, page(s) 54-55

Web de données et création de valeurs : le champ des possibles. Pôle 3 – Données liées et documentation médicale, Jean CHARLET, page(s) 56-58

Web de données et création de valeurs : le champ des possibles. Pôle 3 – OntoToxNuc : recherche d’information et enjeux pour la collaboration et la valorisation, Anne-Claire LE PICARD, page(s) 59

Web de données et création de valeurs : le champ des possibles. Pôle 3 – Enrichissement d’une base documentaire pour un système de recommandation dans le tourisme, Hacène CHERFI, Ghislain ATEMEZING, Florence AMARDEILH, François ROUZÉ, page(s) 60-62

Web de données et création de valeurs : le champ des possibles. Pôle 3 – Écrire avec une machine à calculer, écrire pour une machine à calculer, Stéphane CROZAT, page(s) 62-64

Web de données et création de valeurs : le champ des possibles. Pôle 3 – Que voit réellement Google de la sémantique des pages web ?, Gérald KEMBELLEC, page(s) 65

Web de données et création de valeurs : le champ des possibles. Pôle 3 – ELI : une « mise en lien » des textes juridiques européens, Thomas FRANCART, Jean DELAHOUSSE, page(s) 66-67

Web de données et création de valeurs : le champ des possibles . Dossier. Sources & ressources. , Sélection proposée par Adriana Lopez-Uroz (Cnam-INTD), page(s) 68-69

Colloque : Une nouvelle histoire de la critique d’art à la lumière des humanités numériques ?

Logo du projet critiques

Logo du projet critiques

Une nouvelle histoire de la critique d’art à la lumière des humanités numériques ?

(du milieu du XIXe siècle à l’Entre-deux-guerres)

Lien sur Calenda

Colloque organisé par Anne-Sophie Aguilar (Paris 1, HiCSA), Eléonore Challine (ENS Cachan), Christophe Gauthier (Ecole nationale des Chartes), Marie Gispert (Paris 1, HiCSA), Gérald Kembellec (CNAM, Dicen-IdF), Lucie Lachenal (Paris 1, HiCSA), Eléonore Marantz (Paris 1, HiCSA), Catherine Méneux (Paris 1, HiCSA).

Paris, galerie Colbert de l’INHA le 18 mai 2017 et École des Chartes le 19 mai 2017

LE PROGRAMME DE RECHERCHE « BIBLIOGRAPHIES DE CRITIQUES D’ART FRANCOPHONES »

Initié en 2014 et soutenu par le Labex CAP, la Comue Hésam, l’HiCSA et l’Université Paris 1, le programme de recherche « Bibliographies de critiques d’art francophones » réunit une équipe interdisciplinaire d’historiens de l’art, de l’architecture, du cinéma, de la photographie et de spécialistes des sciences de la communication et de l’information. Il a pour objectif de valoriser la recherche dans le domaine de la critique d’art en mettant à disposition des chercheurs les bibliographies primaires de critiques d’art existantes. Les références bibliographiques seront relatives aussi bien aux beaux-arts qu’à l’architecture, aux arts décoratifs, à l’affiche, à la photographie, au cinéma, mais aussi à la littérature ou à la politique si les critiques ont écrit sur ces sujets.

Le socle de ce programme est la réalisation d’un site internet. Ce site contiendra un répertoire monographique permettant d’accéder à une page par critique, comprenant des documents .pdf téléchargeables (bibliographie primaire du critique, bibliographie sur le critique, sources d’archives), signés par les chercheurs qui les ont élaborés et édités par l’équipe du programme de recherche ; il ouvrira également sur une base de données répertoriant l’ensemble des références présentes dans les bibliographies primaires des critiques d’art mises en ligne ; enfin, le site proposera un annuaire des chercheurs ayant collaboré au projet.
Ce site internet sera lancé fin décembre 2016 et sera présenté au public et aux spécialistes lors d’une journée d’étude inaugurale le 3 février 2017. Outil pratique mis à disposition des chercheurs, il soulève également un certain nombre de questionnements théoriques. Ce colloque souhaite donc à la fois exploiter les possibilités de la base et réfléchir à ses répercussions dans l’approche de la critique d’art.

APPEL A COMMUNICATIONS

Compris dans un premier temps comme un simple outil d’une histoire de la réception des œuvres, les écrits relevant de la critique d’art ont souvent été cités sans tenir compte du contexte de leur énonciation et surtout de l’identité de leurs auteurs. Si les études monographiques de qualité se sont récemment multipliées, on observe que la médiation des connaissances sur la critique d’art continue de passer par des corpus fragmentés et des anthologies. Aujourd’hui, les outils numériques permettent d’aller plus loin, et de proposer des modèles d’organisation et de diffusion du savoir qui envisagent différemment la critique d’art, loin de son statut de simple marginalia de l’œuvre commentée. Partant de ce constat, le programme de recherche Bibliographies de critiques d’art francophones (Labex CAP, HeSam université, Université Paris 1) lancera à la fin de l’année 2016 un site proposant non seulement la bibliographie complète d’auteurs ayant exercé la critique d’art mais donnant également la possibilité de faire des recherches par champ (date, revue, auteur, etc.).

Plus qu’un simple outil documentaire, ce futur site permet de revoir en profondeur la manière d’aborder la critique d’art et les critiques d’art. Non discriminant, puisqu’il ne prévoit pas de typologie ou de classement autre que le support de diffusion du texte (article, ouvrage ou chapitre d’ouvrage), interdisciplinaire, ce site ne vise pas à l’appréciation de la valeur critique du texte – éminemment subjective – au profit d’une vision d’ensemble de la production littéraire des auteurs concernés, quel que soit le champ artistique sur lequel leur regard s’est porté (photographie, cinéma, beaux-arts, architecture, etc.). Il permet ainsi une approche renouvelée à la fois de la production critique de chaque auteur – aucun texte ne prenant le pas sur un autre – et sur la critique d’art en général dont le champ se voit élargi à une grande diversité à la fois d’objets et de supports. Ce sont ces renouvellements, qui sont également des questionnements théoriques, que le colloque se propose d’aborder selon quatre axes.

  1. Faire carrière
  2. Privilégiant les critiques d’art à la critique d’art, le site affirme tout d’abord une approche monographique qui pose un certain nombre de questions. Prendre en compte l’ensemble des écrits d’un auteur ayant exercé la critique en envisageant le temps long permet ainsi de s’interroger sur son positionnement dans un champ, littéraire, artistique, voire commercial pour les arts qui sont aussi des produits de consommation, et sur l’évolution de ce positionnement. Peut-on, à proprement parler, utiliser le terme de « carrière » pour un critique et comment en déterminer les étapes à la fois professionnelles et intellectuelles ? Comment cette « carrière » peut-elle se construire face à la nécessité de rendre compte d’une actualité artistique toujours plus dense ? Peut-on, pour des domaines plus neufs ou plus techniques comme ceux de l’architecture, du cinéma ou de la photographie, véritablement parler de critique d’art professionnel ?

  3. Masse critique
  4. Proposer des bibliographies à finalité exhaustive suppose de prendre en compte l’ensemble des écrits d’un critique dans une approche qui ne soit plus qualitative mais quantitative. La « masse critique » ainsi dégagée suppose une réévaluation des corpus. Dans quelle mesure permet-elle une réflexion sur la place de certains textes, non plus donnés isolés mais réinscrits dans une histoire et dans un corpus, dans une sorte de génétique de la critique qui permettrait de déconstruire certains mythes fondateurs. Comment ces textes ont-il pu faire l’objet de refonte et de réédition et avec quelles conséquences ? Mais cette masse critique peut engager également à une approche statistique ou plus sociologique, posant la question de la constitution d’une expertise et de l’existence d’une « critique moyenne ».

  5. Nouveaux corpus
  6. Au sein de cette « masse critique », certains types de textes ou de supports souvent minorés retrouvent leur place dans la production d’un critique. La confrontation de bibliographies exhaustives permet ainsi de mettre en lumière une nouvelle manière de faire de la critique d’art à cette période et pose la question des supports et formes de publication. Quelles sont les nouvelles formes que prend cette critique d’art, enquêtes ou interviews d’artistes ou de collectionneurs par exemple ? Quel est le rôle joué par les préfaces de plus en plus nombreuses écrites par les critiques d’art dans les catalogues de revues et comment leur étude peut-elle permettre de réfléchir par des cas concrets au fameux système « marchand critique » ? Du côté des supports, on peut s’interroger sur la place prise par les quotidiens dans le champ critique mais aussi sur la manière dont s’articulent, pour l’architecture, le cinéma ou la photographie, écrits dans les revues techniques et écrits dans les revues artistiques.

  7. Au-delà de la critique d’art
  8. Interdisciplinaire, la base/le site met également en lumière la polygraphie essentielle des auteurs ayant pratiqué la critique. Souvent touche-à-tout, ils s’intéressent à des domaines très différents, fréquemment dictés par l’actualité, ce que permet de montrer une bibliographie exhaustive. Cependant, une fois ce constat posé, la confrontation entre les textes continue de poser un certain nombre de questions. Existe-t-il encore des champs spécifiques, par exemple pour les arts décoratifs ? Le fait d’écrire sur plusieurs media suppose-t-il une certaine analogie dans la structuration de nouveaux champs ? Comment évolue l’idéal d’unité des arts à la lumière de ces écrits sur l’art et de leurs supports ? Y a-t-il une approche spécifique d’ensembles nouveaux, de pratiques nouvelles, qu’elles soient considérées ou non comme artistiques, par exemple dans le champ politique ?

    Les propositions de communication, d’une page maximum, et indiquant les principales sources utilisées, sont à adresser avec un CV avant le 2 novembre 2016 à :
    Anne-Sophie Aguilar (anso.ag@free.fr), Eléonore Challine (eleonore.challine@ens-cachan.fr), Christophe Gauthier (christophe.gauthier@enc-sorbonne.fr), Marie Gispert (marie.gispert@wanadoo.fr), Lucie Lachenal (lucielachenal@free.fr), Eléonore Marantz (eleonore.marantz-jaen@univ-paris1.fr) et Catherine Méneux (catherine.meneux@orange.fr).

    Les réponses seront communiquées au plus tard le 9 janvier 2017.

Big data – Open data, actes de la conférence Document numérique et société

Big data – Open data

Quelles valeurs? Quels enjeux?

Sous la direction de : Evelyne Broudoux, Ghislaine Chartron
Collection : Information & Stratégie
Editeur : De Boeck Supérieur

Big data - Open data Quelles valeurs? Quels enjeux?  Sous la direction de : Evelyne Broudoux, Ghislaine Chartron, Collection : Information & Stratégie Editeur : De Boeck Supérieur

Du Big Data à l’Open Data, les enjeux techniques, sociétaux et industriels de l’exploitation massive de données informationnelles en ligne.
Depuis 2006, la conférence « Document numérique et société » se donne pour mission d’apporter des éclairages sur les transformations des dispositifs d’information à l’ère numérique, en privilégiant la dimension sociale.

Cette 5e édition se focalise sur l’effervescence autour du Big data et de l’Open data qui anime autant les milieux d’affaires que les gouvernements et les scientifiques. Elle s’explique par l’interconnexion généralisée transformant l’économie des services et les internautes en fournisseurs de données, mais également par l’importance grandissante de l’internet des objets et, d’une manière générale, par les capacités computationnelles qui traitent désormais l’information sur toute sa chaîne de production-diffusion et transformation.

Cet ouvrage rassemble les textes présentés lors du colloque de Rabat les 4 et 5 mai 2015, des recherches théoriques, expérimentales et des analyses critiques qui s’inscrivent dans la perspective des études sur le phénomène du Big data et de l’Open data en termes d’enjeux pour nos sociétés et de création de valeurs.

  • Pour les professionnels de la documentation ;
  • pour les chercheurs et enseignants en information et documentation ;
  • pour les étudiants en Humanités numériques.

Appel à communication : Écrilecture augmentée dans les communautés scientifiques

Labex Hastec

Humanités numériques et construction des savoirs (extension de la date de soumission de résumé)

Le web et les technologies associées au lien hypertexte sont à l’origine d’environnements de lecture enrichie dont nous avons commencé à établir une photographie sous plusieurs angles : celui de l’innovation logicielle et ceux des usages actuels et à venir. Cette lecture enrichie qui repose sur des actes scripturaux nous a incités à reprendre le concept d’écrilecture théorisé par Pedro Barbosa dans sa thèse de 1992 et né de la rencontre des pratiques littéraires créatrices avec l’ordinateur. Alain Vuillemin l’avait repris pour caractériser ce nouveau comportement du lecteur entraîné dans des manipulations créatrices face à l’écran. Nous situons l’écrilecture dans l’évolution des pratiques historiques de construction de l’érudition et pensons à la « lettrure » observée dès le moyen âge qui, comme le rappelle Emmanuel Souchier, désignait une seule et même activité. Réservées à une élite de « lettrés », la lecture et l’écriture étaient pensées comme un seul processus, constitué par des actions liées et complémentaires dans lesquelles l’activité de lecture, hautement structurante, permettait au récepteur de la connaissance construite de devenir acteur par l’enrichissement des idées transmises. Ce procédé intervenait par capitalisation intellectuelle et agrégation avec sa réflexion dans une transformation scripturale et pouvait être matérialisé sur le support physique au moyen de marginalia, notes de bas de page et autres annotations. Aujourd’hui, les processus d’écrilecture sont soutenus par de multiples fonctionnalités logicielles et rendus autonomes par raisonnement computationnel sur la sémantique.

Les pratiques liées aux usages de lecture « savante » se sont perpétuées au cours des siècles et les annotations sont elles-mêmes devenues objets d’études, comme plus-values des textes originaux ou documents à part entière. Les enrichissements peuvent être observés sous un angle épistémologique par la construction de l’autorité, ou sous des éclairages philologiques, paléographiques sur les documents originaux ou encore prosopographiques en éditorialisant les biographies et bibliographies d’auteurs enrichies de notices d’autorité. Si nous observons, par exemple les collections léguées à des musées et bibliothèques, les notes manuscrites ajoutées par leurs propriétaires aident à la réception située des œuvres, à comprendre leurs inspirations et l’interprétation spécifique qu’ils avaient des ouvrages étudiés. Le commentaire, la critique implicite ou explicite des écrits sont en effet de précieux atouts pour juger, en complément de l’œuvre, de la compréhension d’un auteur sur des écrits antérieurs et de sa réception sur le sujet traité, tout du moins la manière de le traiter. La posture épistémologique émerge donc parfois de manière implicite par l’analyse des corpus d’annotation, mais parfois aussi de manière très explicite par la critique annotée dans les ouvrages étudiés.

D’une manière générale, l’écrilecteur est un sélectionneur, un acteur qui de par ses pratiques est directement associé à la transformation du texte lu et plus généralement des documents – sous la forme d’annotations et de commentaires. En effet, la typologie documentaire fait ressortir la pluralité de matérialités d’objets observés et des grilles de lecture associées. Si un certain nombre d’outils d’écrilecture ont été élaborés ces vingt dernières années dont il serait utile de dresser des typologies et des bilans d’appropriation par les communautés concernées, de nouveaux modèles sont en cours d’élaboration. Souvent basés sur l’enrichissement automatisable des références, ces nouveaux modèles interrogent la notion d’augmentation qui – évoquons le point de vue d’H. Arendt – provient de l’autorité : ce que l’autorité augmente c’est la fondation (augmenter = augere). Rappelons que cet objectif d’augmentation a concerné « l’intelligence humaine » dès les années 1960 avec NLS (oN-Line System), le dispositif logiciel issu du projet de recherche de Douglas Engelbart intitulé « Human augmentation framework ». Dès ses origines, le Web était éditable depuis Nexus, le premier navigateur pensé par Tim Berners Lee. Une approche historique retraçant les grandes étapes de l’écrilecture informatique pourrait mettre en perspective l’entrelacement de l’ingénierie avec les approches des sciences humaines et sociales.

La multiplication potentielle des fonctionnalités interroge la qualité de la lecture et ses modifications : quels défis sont à relever par l’enseignement face aux lectures close, hyper et machine décrites par Katherine Hayles ? Quelles conséquences pour la lecture face à sa verticalisation ?

Les données scientifiques, textuelles ou multimédias, sont numérisées à grande échelle par les communautés scientifiques, les États et les sociétés privées. Avec l’avènement du Web social et de la sémantique proposée par les contenus liés sur le Web dans les moutures successives pensées par Tim Berners Lee, il est devenu possible de transposer de manière systématique, sinon aisée les corpus documentaires des sciences humaines vers un espace numérique accessible unique accessible à tous de manière simultanée et de les lier pour en faciliter l’exploitation savante dans l’idée de ce que l’on appelle les humanités numériques.

Certaines productions documentaires scientifiques nativement numériques, multi, cross et transmédias reposent sur la collaboration massivement distribuée (citizen science) ou internalisent la réception des publics. De nouveaux modèles éditoriaux restent donc à imaginer où les réponses des lecteurs pourraient augmenter et diversifier les corpus « sémantisés », leur exposition peut en être facilitée si une indexation adéquate a été réalisée sur les plateformes de diffusion.

Nous appelons donc, à la suite du séminaire « Ecrilecture », les membres de la communauté scientifique à partager leurs réflexions et retours d’expérience sur le sujet de la co-construction d’un savoir scientifique grâce à des approches innovantes de médiation. Sont attendus pour ce livre, des propositions de chapitres concernant la théorie, les études de cas et les retours d’expérience touchant aux domaines suivants :

  1. Coordination numérique de la construction des savoirs collectifs ;
  2. Construction de la connaissance scientifique par l’annotation ;
  3. Aspects conceptuels : modélisation et réalisation de dispositifs adaptés à l’écrilecture, nouveaux modèles de documents scientifiques ;
  4. Médiation et vulgarisation scientifique en contexte dans le temps et l’espace (géolocalisation / chrono-tagging…) : méthodologies de construction des savoirs augmentés personnalisables par la sémantique (recommandation, détection d’entités nommées, facettes …) ;
  5. Retours d’expériences sur les projets de corpus « sémantisés », l’importance de l’éditorialisation des métadonnées ;
  6. Entrepôts de la science, matière première des humanités numériques : description, normes et interaction ;
  7. Bibliographies scientifiques annotées : l’intérêt d’une approche collaborative dans les unités de recherche ;
  8. Aspects sociohistoriques de la construction de l’écrilecture informatique.

Format

  • Évaluation en double-aveugle
  • Volume des chapitres : entre 30 et 35 000 signes (espaces compris)

Calendrier

  • 7 septembre 2015 21 septembre 2015(prolongation) : date limite d’envoi des résumés d’une page accompagnés d’une courte bibliographie à gerald.kembellec@cnam.fr et evelyne.broudoux@cnam.fr
  • 23 octobre 2015 9 novembre 2015 : notification de sélection des résumés
  • 25 janvier 15 février 2016 (prolongation): réception des chapitres (télécharger la feuille de style)
  • 18 avril 2016 25 mai : retours des évaluateurs
  • 25 avril 2016 10 juin: notification aux auteurs
  • 15 juillet 20161 septembre 2016 : réception des chapitres définitifs, à gerald.kembellec@cnam.fr et evelyne.broudoux@cnam.fr
  • 30 septembre 2016 : envoi des chapitres à l’éditeur
  • Parution en décembre 2016 ou janvier 2017.

Comité scientifique :

  • Aurélien Berra (Paris-Ouest, ArScAn)
  • Evelyne Broudoux (Cnam, Dicen)
  • Ghislaine Chartron (Cnam, Dicen)
  • Orélie Desfriches-Doria (Lyon 3, Elico)
  • Laurence Favier (Lille 3, Geriico)
  • Luc Grivel (Paris 1, Paragraphe)
  • Gérald Kembellec (Cnam, Dicen)
  • Olivier Le Deuff (Bordeaux Montaigne, Mica)
  • Julie Lemarié (Toulouse Le Mirail, CLLE)
  • Annaig Mahé (ENC/Urfist, Dicen)
  • Louise Merzeau (Paris-Ouest, Dicen)
  • Camille Paloque-Berges (Cnam, HT2S)
  • Loïc Petitgirard (Cnam, HT2S)
  • Alexandra Saemmer (Paris 8, CEMTI)
  • Brigitte Simonnot (Université de Lorraine, Crem)
  • Florence Thiault (Lille 3, Geriico)

Éditeur :

ISTE éditions.