Archives du mot-clé open data

Conférence Data and digital humanities

Thématique : Data

La 2ème conférence internationale « Digital Tools and Uses », https://ddh20.sciencesconf.org/ dont le Laboratoire est partenaire, va se tenir en octobre 2020 en Tunisie. Dans ce cadre, Gérald Kembellec organise un Workshop sur les enjeux de la donnée en contexte des humanités numériques. Cet événement est en lien avec la thématique « Data, médiation, valorisation » du Laboratoire, avec des réflexions sur les modèles, les méthodes de traitement des données des humanités : quels sont les particularités disciplinaires, est-il possible et souhaitable de penser cet aspect des humanités de manière interdisciplinaire ?

Les membres du Laboratoire intéressés par le sujet sont invités à se rapprocher de Gérald Kembellec pour toute information complémentaire.

Conférence internationale sur les humanités numériques

Humanités numériques

TEI et encodage des textes anciens

The digital humanities offer a particularly rich research field of studies for data processing, apart from those of the hard sciences and the social sciences. Indeed, the humanities are rarely subject to privacy principles (privacy by design, GDPR…) that affect most social science works and are not just about digital or binary data. Moreover, in DH the data pre-exist and are most often already known if they are not collected and formalized. In this specific context, we propose in this track to question the practices resulting from the constitution of corpus and uses of data in humanities.

This track is intended to be interdisciplinary to cover various aspects of the humanities that use various models, methods and analyses for the cross-fertilization of knowledge. With regard to the reuse of research-generated data, its implementation is encouraged with developments in open and reproducible science. For example, we propose to analyze links between political and social injunctions to data sharing, the requirements of funding organizations and the reality of Humanities issues. We also wish to discuss methods of controlling the quality of the data whether they are “captured” (i.e. Drucker’s “capta”) or “produced” as well as the possibility of “linking” them with each other and with authoritative organisms, vocabularies, and description schemes.

So, what will be the new uses of research data to consider in Humanities? When and how to prepare to share the data produced? Finally, what are the pitfalls to avoid?

Main topics :

Contributions may address one or more of the following topics

  • Visualization of humanities data for the answer to scientific questions (questions of ethics, graphic semiology …).
  • Mathematics and humanities (statistics, clustering …).
  • Natural Language Processing (NLP) and the humanities.
  • Emergence of research questions in humanities through digital methods.
  • Cartography and the humanities.
  • Data identified and linked in humanities (LOD).
  • Methodology and modeling in digital humanities: the importance of maieutic (Socratic method).
  • Practices of sharing data from digital humanities.
  • Multidisciplinary point of view dealing with humanities’ data: Methodological and epistemic negotiations.

Scientific Committee

  • Kmar BENDANA, University of la Manouba, Tunisia
  • Frédéric CLAVERT, University of Luxembourg, Luxembourg, Luxembourg
  • Marija DALBELLO, Rutgers School of Information and Communication, United States
  • Frédéric DARBELLAY, University of Genève, Switzerland
  • Martin GRANDJEAN, University of Lausanne, Switzerland
  • Olivier LE DEUFF, University of Bordeaux-Montaigne, France
  • Ingrid MAYEUR, University of Liège, Belgium
  • Xavier-Laurent SALVADOR, University of Villetaneuse, France
  • René SCHNEIDER, HEG-SO, Genève, Switzerland
  • Dominique TRUDEL, UQAC, Canada
  • Marcello VITALI-ROSATI, University of Montréal, Canada
  • Eveline WANDL-VOGT, Austrian Academy of Sciences, Austria

Bibliography

  • Abiteboul, S., & Dowek, G. (2017). Le temps des algorithmes. Le pommier.
  • Bailey, C. D. (2014). Psychopathy, Academic Accountants’ Attitudes toward Unethical Research Practices, and Publication Success. The Accounting Review, 90(4), 1307‑1332. https://doi.org/10.2308/accr-50970
  • Bertin, J (1967) Sémiologie Graphique. Les diagrammes, les réseaux, les cartes. With MarcBarbut [et al.]. Paris: Gauthier-Villars. (Translation 1983. Semiology of Graphics by William J. Berg).
  • Borgman, C. L. (2010). The digital future is now: A call to action for the humanities.
  • Busa, R. (1974). Index Thomisticus Sancti Thomae Aquinatis Operum Omnium Indices Et Concordantiae in Quibus Verborum Omnium Et Singulorum Formae Et Lemmata Cum Suis Frequentiis Et Contextibus Variis Modis Referuntur.
  • Busa, R. (1980). The annals of humanities computing: The index thomisticus. Computers and the Humanities, 14(2), 83–90.
  • Cardon, D. (2015). A quoi rêvent les algorithmes. Nos vies à l’heure du Big Data. Paris: Le Seuil.
  • Castets-Renard, C., & Gandon, N. (2016). Open data des données de la recherche publique : entre réformes législatives et retour d’expérience sur un guide pratique à destination des chercheurs. LEGICOM, N° 56(1), 67‑75.
  • Drucker, J. (2011). Humanities approaches to graphical display. Digital Humanities Quarterly, 5(1), 1–21.
  • Gandon, F., Sabou, M., & Sack, H. (2017). Weaving a Web of linked resources. Semantic Web, 8(6), 767-772.
  • Gingras, Y. (2018). Les transformations de la production du savoir : de l’unité de connaissance à l’unité comptable. Zilsel, 4(2), 139‑152.
  • Kaplan, F. (2015). A map for big data research in digital humanities. Frontiers in digital humanities, 2(1).
  • Kembellec, G., & Broudoux, E. (Eds.). (2017). Reading and Writing Knowledge in Scientific Communities: Digital Humanities and Knowledge Construction. John Wiley & Sons.
  • Lemercier, C., & Zalc, C. (2019). Quantitative Methods in the Humanities: An Introduction. University of Virginia Press.
  • McCarty, W. (2016). Collaborative research in the digital humanities. In Collaborative Research in the Digital Humanities (pp. 13-22). Routledge.
  • Molloy, J. C. (2011). The open knowledge foundation: open data means better science. PLoS biology, 9(12), e1001195.
  • Schöch, C. (2013). Big? smart? clean? messy? Data in the humanities. Journal of digital humanities, 2(3), 2-13.

Les actes de la conférence seront publiés et largement diffusés via la plateforme éditoriale de la société savante ACM.

Logo of ACM International Conference Proceedings Series

ACM International Conference Proceedings Series

Séminaire Dicen « Data, médiation, valorisation »

Thématique : Data

Au Conservatoire National des Arts et Métiers

292 Rue Saint-Martin
75003 Paris
Salle 17.2.14, de 13h30 à 17h30.

13h30 – Session 1 : Les données de la recherche, problématiques de production et d’usage (modératrice : Camille Claverie)

– 13h30 – Gérald Kembellec :

Quelques rappels sur les questions institutionnelles liées à la collecte, la l’analyse, la transformation et le partage des données de la recherche. (10 minutes de présentation et 5 de discussion) ;

– 13h45 – Joumana Boustany :

Nous présentera les résultats de son enquête sur les données de la recherche ; (20 minutes de présentation et 10 de discussion) ;

– 14h25 – Olivier Champalle :

Les traces numériques comme objet de connaissances. Quels moyens pour : l’analyse de traces, la capitalisation et l’extraction automatique des connaissances sur le terrain des learning analytics (20 minutes de présentation et 10 de discussion) ;

15h15 – Pause

15h30 Session 2 – Autorité de la donnée, les algorithmes au service de la gouvernance, de l’influence et du marketing (modératrice : Béa Arruabarréna)

– 15h30 – Karim Fraoua :

La datascience appliquée au domaine du marketing : la décision aidée par les données (20 minutes de présentation et 10 de discussion) ;

– 16h10 – Lucile Desmoulins, Camille Alloing (IAE de Poitiers) et Vanessa Mohli (Les Bornées Digital Company) :

Une analyse de l’imbrication entre influence et donnée(s) : Médiations et négociations dans les agences de communication « influenceurs » (20 minutes de présentation et 10 de discussion) ;

– 16h50 – Maryse Carmes :

L’instauration de l’algorithmie dans l’action publique (20 minites de présentation et 10 de discussion) ;

17h30 précise – Clôture

APPEL A COMMUNICATIONS – Data Value Chain in Science & Territories

Thématique : Intelligence

Conférence Data Value Chain in Science and Territories organisée par le laboratoire Dicen-IDF, le comité Codata France, l’Université Paris-Est Marne-la-Vallée, l’Institut Francilien d’Ingénierie des Services

La conférence se déroulera les 14 et 15 mars 2019 sur le site de l’Université Paris-Est Marne-la-Vallée et la médiathèque du Val d’Europe.

Les contributions interdisciplinaires, en ingénierie ou en sciences humaines et sociales, devraient discuter du paradigme des données en tant que source d’information, de connaissances et de divers indicateurs.

Si vous le souhaitez, vous pouvez nous faire part de vos propositions (5 000 à 6 000 caractères) jusqu’au 05 novembre 2018 via Conftool

 

DATA VALUE CHAIN CONFERENCE – THÈMES PRINCIPAUX
Data, Conference, Codata France, Dicen

  • Acquisition de données: IoT (Internet des objets), réseaux intelligents, open data, capteurs, qualité des données, sécurité des données, protection des données et confidentialité, …
  • Typologies de données: caractérisation des différents types de données
  • Qualité des données: référentiels de données, nettoyage des données, validation des données, éthique, données manquantes
  • Traitement des données: normalisation, interopérabilité, modélisation des données, visualisation
  • Extraction de connaissances: data mining, data analytics
  • Médiation des données: interopérabilité, gestion des données dans les organisations, interfaces
  • Data services: plateformes de traitement de données, industrialisation du traitement des données, data literacy
  • Domaines d’application: santé publique et politique sociale, santé intelligente, tourisme intelligent, génie civil, …
DATA VALUE CHAIN CONFERENCE – COMITÉS D’ORGANISATION & SCIENTIFIQUE
Data, Conference, Codata France, Dicen

 

DATA VALUE CHAIN CONFERENCE – TÉLÉCHARGER L’APPEL A COMMUNICATIONS
Data, Conference, Codata France, Dicen

Télécharger l’AAC en français

Télécharger l’AAC en anglais

PLUS D’INFORMATIONS
Data, Conference, Codata France, Dicen

Séminaire – Interfaces – Visualisation de la donnée

Thématique : Data

Programme du séminaire Interfaces – 22 mars 2018 – Visualisation de la donnée
Au Cnam, accès 21 (on peut y arriver par l’accès 17) étage 1, salle 05 (21.1.05) salle 24 (21.1.24), 292 Rue Saint-Martin, 75003 Paris.
Avec l’appel national à la gréve, nous proposons à ceux qui le souhaitent de nous rejoindre à l’url suivante : https://appear.in/dicen-idf. Nous essaierons également d’enregistrer les interventions et de mettre à disposition les présentations.
(Plan d’accès)

Introduction (Gérald Kembellec, Camille Claverie 5 minutes)
Une dataViZ
(1) Enjeux et opportunités de la datavisualisation, approches épistémologique et historique, interagir avec les données (Etienne Armand Amato, 45 min avec questions)
(2) L’écosystème de la datavisualisation (Béa Arruabarrena, 45 min avec questions)
(3) Data Journalisme et/ou systèmes de recommandation, traitement et visualisation, cartographie (Marzia Antenore, 45 min avec questions);
(4) Cartographie des compétences en milieux professionnels (Serge Casasus, 45 min avec questions)

Pouvoir d’agir – Séminaire doctoral ED139

Séminaire transdisciplinaire de l’École doctorale ED139 de Paris Nanterre

Séance organisée par le laboratoire Dicen-IDF

Pouvoir d’agir : Rencontre avec Jacques-François Marchandise

Cofondateur, directeur de la recherche et de la prospective de la Fing et délégué général depuis le 1er janvier 2017.

Focalisant sur la question du pouvoir d’agir, Jacques-François Marchandise présentera la Fing sous l’angle de son postulat « le potentiel transformateur des technologies quand elles sont entre les mains du plus grand nombre ».
À titre d’exemple, il reviendra sur la démarche annuelle, collective et créative, qui convie depuis 2010 décideurs, chercheurs et innovateurs à formuler ensemble les Questions Numériques des années à venir – et à imaginer les manières d’y répondre.
Le cycle de cette année, consacré au ThinkSmall, fournira quelques cas démontrant l’utilité de faire travailler ensemble des chercheurs de différentes disciplines et d’identifier des questions d’acteurs (Etat, collectivités, grandes entreprises, startups, acteurs associatifs, acteurs de l’ESR…).

 

Mardi 25 avril 2017, 14h-16h
Université Paris Nanterre
Bâtiment A, salle A 304
RER A Nanterre université

Ouvert à tous – chercheurs, doctorants, étudiants – sans inscription

IMPORTANT :

Pour les doctorants de Dicen-IDF, ce séminaire peut être validé au titre de la formation doctorale auprès de l’ED 139 de Paris Nanterre ou de l’ED Abbé Grégoire du Cnam (crédits alloués pour toute participation).

Visiter le site de l’ED 139 « Connaissance, langage, modélisation »
Visiter le site de La Fing

Workshop-Hackathon

Pour l’ouverture du site et de la base de connaissances « Bibliographies de critiques d’art francophones » ( http://critiquesdart.univ-paris1.fr/) début février 2017, un Workshop sous forme de Hackathon est organisé par l’équipe afin de familiariser les chercheurs avec ce nouveau dispositif.

Il s’agira alors non seulement d’apprendre à utiliser toutes les potentialités de la base grâce à un éclairage à la fois du côté de l’histoire de l’art, de la prosopographie et des humanités numériques mais aussi de commencer à constituer des objets de recherche. Sur inscription dans la limite des places disponibles.

Télécharger le programme.

Les jeux de données issus de la base sont mis à disposition pour permettre aux chercheurs intéressés, quelle que soit leur discipline, de constituer des corpus à analyser (http://critiquesdart.univ-paris1.fr/opendata.php).

DataViz des pseudonymes des critiques d'rt

Différents pseudonymes utilisés par les critiques d’art

DataViz à partir des jeux de données
Période et volume de collaboration des critiques à des revues.

Big data – Open data, actes de la conférence Document numérique et société

Big data – Open data

Quelles valeurs? Quels enjeux?

Sous la direction de : Evelyne Broudoux, Ghislaine Chartron
Collection : Information & Stratégie
Editeur : De Boeck Supérieur

Big data - Open data Quelles valeurs? Quels enjeux?  Sous la direction de : Evelyne Broudoux, Ghislaine Chartron, Collection : Information & Stratégie Editeur : De Boeck Supérieur

Du Big Data à l’Open Data, les enjeux techniques, sociétaux et industriels de l’exploitation massive de données informationnelles en ligne.
Depuis 2006, la conférence « Document numérique et société » se donne pour mission d’apporter des éclairages sur les transformations des dispositifs d’information à l’ère numérique, en privilégiant la dimension sociale.

Cette 5e édition se focalise sur l’effervescence autour du Big data et de l’Open data qui anime autant les milieux d’affaires que les gouvernements et les scientifiques. Elle s’explique par l’interconnexion généralisée transformant l’économie des services et les internautes en fournisseurs de données, mais également par l’importance grandissante de l’internet des objets et, d’une manière générale, par les capacités computationnelles qui traitent désormais l’information sur toute sa chaîne de production-diffusion et transformation.

Cet ouvrage rassemble les textes présentés lors du colloque de Rabat les 4 et 5 mai 2015, des recherches théoriques, expérimentales et des analyses critiques qui s’inscrivent dans la perspective des études sur le phénomène du Big data et de l’Open data en termes d’enjeux pour nos sociétés et de création de valeurs.

  • Pour les professionnels de la documentation ;
  • pour les chercheurs et enseignants en information et documentation ;
  • pour les étudiants en Humanités numériques.

Appel à participation : Conférence Document Numérique et Société

La 5e conférence Document Numérique et Société se déroulera sur les valeurs et les enjeux de l’Open data et du Big data à l’Ecole des Sciences de l’Information de Rabat, au Maroc, les 4 et 5 mai prochains.

Programme

lundi 4 mai 2015

09:00 – 10:30
Discours de bienvenue – Officiels

10:30 – 10:45
Pause-café

10:45 – 11:30
Présentations Entreprises

11:30 – 12:00
Anonymisation des données et protection de la vie privée : questionnements récents, propositions actuarielles, Conférencier invité : Michel BERA, Chaire de Modélisation Statistique du Risque, CNAM

12:00 – 13:30
Déjeuner

13:30 – 15:00
Enjeux épistémologiques

13:30 – 14:00
› Big Data et machinisation de la médiation symbolique
Maude BONENFANT, Marc MENARD, André MONDOUX, Maxime OUELLET, Université du Québec à Montréal

14:00 – 14:30
› La controverse épistémologique Big Data face à la réalité de l’appropriation de nouveaux paramètres par les acteurs métier en entreprise Anna NESVIJEVSKAIA, Dispositifs d’Information et de Communication à l’Ère du Numérique, DICEN-IDF, EA7339, CNAM-Paris

14:30 – 15:00
› L’ambiguïté épistémologique des big data : le cas de la donnée web en sciences sociales
Eglantine SCHMITT, Connaissance et Organisation des systèmes techniques, COSTECH EA 2223, Compiègne

15:00 – 15:15
Pause-café

15:15 – 15:45
› Datavisualisation : Principes, enjeux et perspectives pour les systèmes de connaissances de demain Béatrice ARRUABARRENA,  Paragraphe (EA349), Paris 8

15:45 – 16:15
› Open, Big, Collaboration : trois paradigmes de l’innovation au 21ème siècle – Fidelia IBEKWE-SANJUAN, IRSIC, EA4262, Aix-Marseille Université – AMU; Françoise PAQUIENSEGUY ELICO, EA 4147, Lyon

16:15 – 16:30
Rafraichissements

16:30 – 18:00
Enjeux sociétaux

16:30 – 17:00
› De quoi l’Open Data est-il le nom ? Yohan BARRES, COSTECH, EA 2223, Compiègne

17:00 – 17:30
› Transparence et big data : revers et infortunes Hélène JEANNIN, Orange Labs, Issy les Moulineaux

17:30 – 18:00
› Gouverner par les données ? La plateforme de diffusion de données comme instrument de gouvernement – Antoine COURMONT, Centre d’études européennes de Sciences Po, EA4459, Paris

mardi 5 mai 2015

09:00 – 10:30
Enjeux sociétaux

09:00 – 09:30
› Asymétries, enjeux géopolitiques des données
Ghislaine CHARTRON, Evelyne BROUDOUX, DICEN-IDF, EA7339, CNAM-Paris

09:30 – 10:00
› DataCite au service des données scientifiques – identifié pour valoriser – Herbert GRUTTEMEIER, Institut de l’information scientifique et technique , CNRS-Nancy

10:00 – 10:30
› La datavisualisation comme outil de pilotage et d’évaluation de la recherche scientifique médicale Hanae LRHOUL, ESI-Rabat et DICEN-IDF ; Ghislaine CHARTRON, DICEN-IDF (EA7339) ; Ahmed BACHR, ESI-Rabat ; Othman BENAMMAR, Université Hassan II Casablanca

10:30 – 10:45
Pause-café

10:45 – 11:15
› Vers une stratégie basée sur les apprenants et le Big Data pour améliorer le processus d’apprentissage en ligne – Sbihi, BOUBKER Ecole des Sciences de l’Information-Rabat

11:15 – 11:45
› Les politiques locales en matière d’Open Data au prisme des dispositifs numériques d’innovation de services: l’intelligence territoriale en perspectives Jean-Baptiste LE CORF, DICEN-IDF (EA7339)

11:45 – 12:15
› Un modèle Big Data orienté vers la cyberdémocratie – Youssef TAHER, Centre d’orientation et de planification de l’éducation, Rabat

12:15 – 12:45
› De l’intention à la valeur dans l’exploitation des données ouvertes  Slim TURKI,, Luxembourg Institute of Science and Technology  (LIST) ,  Muriel FOULONNEAU, Centre de Recherche Public Henri Tudor, Luxembourg.

12:45 – 14:00
Déjeuner

14:00 – 15:30
Enjeux techniques

14:00 – 14:30
› MapReduce algorithm for optimizing Big Electronic Records indexing process – Siham YOUSFI, Ecole des Sciences de l’information ESI / Computer Science Department, EMI School, Mohammed V University

14:30 – 15:00
› Reconstruire le sens associé à l’archive : mobilisations sémiotique et documentaire du Linked Open Data Lénaïk LEYOUDEC, Connaissance et Organisation des systèmes techniques, COSTECH EA 2223, Compiègne

15:00 – 15:30
› Big data for improving open e-government services – Fouad NAFIS, Siham YOUSFI, Computer Science Department, EMI School, et ESI, Rabat

15:30 – 15:45
Pause-café

15:45 – 16:15
› Adaptation normative des Big data en e-Learning  Mokhtar BEN HENDA, MICA EA-4426, Bordeaux

16:15 – 16:45
› Big-Learn : Vers un outil basé sur le Big Data pour améliorer les recherches au sein d’un environnement E-Learning  KARIM AOULAD ABDELOUARIT, Université Abdelmalek Essaâdi , Tétouan

16:45 – 17:45
Enjeux industriels et professionnels

16:45 – 17:15
› Urban Open Data et innovation participative : quelle stratégie durable pour le Grand Lyon ? Martine Vila-Raimondi, Valérie LAROCHE, ELICO, EA 4147, Lyon

17:15 – 17:45
› Fouille de données spatio-temporelle Application à un système de modélisation des déplacements touristiques. EROL Elisabeth, Centre de Recherche en Economie, Gestion, Modélisation et Informatique Appliquée, Faculté de Droit et d’Economie, Martinique.

Nouveaux Espaces de travail – Ville Numérique – Open Data : UNIVCAMP édition 2015


UNICAMP édition 2015 :

2 jours pour fabriquer
ensemble la société nouvelle société collaborative


Professionnels, académiques, chercheurs et étudiants, venez chercher et trouver ensemble, dans un temps limité, des solutions aux questions posées par la nouvelle société collaborative. En s’appuyant sur toutes les compétences en présence, UNIVCAMP permet, en une journée, de transformer les idées en projets jusqu’à la conception de maquettes de produits ou de services en s’appuyant sur toutes les compétences en présence..

Thèmes de l’édition 2015 :

Mercredi 15 avril Jeudi 16 avril
  • #Bureau du futur : L’innovation technologique transforme les espaces de travail et les campus universitaires !
  • #Gare 2.0 : Et si votre gare se transformait aussi en lieu de travail, de services et d’échanges !
  • #Télécentres et coworking : de nouveaux espaces dans les territoires, regroupant animations et services innovants?
  • #ville numérique : L’innovation numérique est- elle toujours au service de la ville de demain ?
  • #open data : Quels outils d’aide à la décision pour l’aménagement des territoires à base de données ouvertes.

Depuis 4 ans, les Masters MIPI (immobilier d’entreprise) et MITIC (technologies de l’information) organisent à l’UNIVersité le barCAMP UNIVCAMP.

Dans l’édition 2015, avec 5 ateliers collaboratifs UNIVCAMP est l’occasion :

  • D’explorer les nouveaux horizons de la ville de demain,
  • D’exploiter le gisement des open data,
  • D’imaginer les nouveaux espaces et modes de collaboration au travail.

UNICAMP des Masters Mipi-Mitic offre une expérience intense de la collaboration tout azimut dans un esprit créatif, ouvert et concret.

MERCI DE VOUS INSCRIRE SUR LE SITE : http://www.univcamp.fr/
@Univcamp


En partenariat avec le laboratoire Dicen-idf, le Syntec numérique sur l’Atelier « ville numérique », SNCF Développement, IT77 et la direction immobilière de l’université sur les ateliers concernant les espaces de vie/espaces de travail, la CCI du 77 et le SAN du Val d’Europe pour Open data


C. Meyer, S. Mercier, I. Fasshauer,  C. Bourret, membres de Dicen-idf

5e conférence « Document numérique et Société »

Open data, Big data : quelles valeurs, quels enjeux ?

4 et 5 mai 2015 – Rabat – Maroc.
L’internet des objets, l’interconnexion généralisée transformant les services et les comportements des internautes en fournisseurs de données et d’une manière générale les évolutions technologiques liées aux capacités computationnelles qui traitent l’information sur toute sa chaîne de transformation nous pressent d’interroger l’effervescence actuelle autour du « Big Data », qui anime autant les milieux d’affaires que les gouvernements et les scientifiques d’origine disciplinaire variée.

Buzzword ayant le vent en poupe ces trois dernières années, le « Big Data » souvent désigné comme une « mine d’or » qualifiant un « océan mondial de données » révèle la prise de conscience de l’expansion rapide d’un nouvel univers constitué par des données dont le traitement formerait un monnayable eldorado. Le « Big Data » vise ainsi l’exploitation massive de données informationnelles présentes, fabriquées ou générées en ligne, dans des cadres juridiques en cours de définition et de négociation.

Au terme « Big Data », se trouve fréquemment associé « Open Data » qui apparaît comme une condition associée, au moins dans la sphère publique. Dans le domaine de la recherche, le mouvement du libre accès aux résultats scientifiques – que ce soit les textes ou les données – est en phase avec cet enjeu majeur d’exploration et d’interconnexion sans limites de ces données, au cœur des promesses du datamining. Les démocraties se sont emparées elles-aussi de cet idéal d’ouverture et construisent un accès renouvelé aux données publiques projetant des valeurs de transparence, de participation citoyenne,  de soutien à l’innovation économique. Ceci démarre en 2009 par l’ouverture du site data.gov de l’Open Government d’Obama, puis encouragé par l’Union Européenne le mouvement se traduit en France par le développement actuel de la « Plateforme ouverte des données publiques françaises », data.gouv.fr. Il en est de même pour le Maroc à travers sa plateforme dédiée aux données publiques (data.gov.ma). Ainsi, la France se classe 10e sur 77 dans le baromètre 2013 de l’Open Data Institute  et le Maroc 40e . Enfin, autre phéno­mène et non des moindres en terme de prolifération des données, celles livrées gratuitement par les internautes sur les réseaux sociaux, services, blogs, sites web d’agrégation d’informations vidéos, images, textes…et potentiellement exploitables par le marketing et tous les services dont les objectifs reposent sur la réalisation de prévisions.

Au sein des entreprises, de nombreux projets voient le jour dont les visées vont d’une simple optimisation des performances à une transformation profonde des modèles d’affaires. La visualisation de données devient un enjeu associé à l’efficience du pilotage. La possibilité d’une prise de décision en temps réel et l’enrichissement des données habituelles par de nouvelles sources de granularités plus fines permettent d’ajuster la relation continue avec le client, de concevoir des produits et services affinés en fonction du profil et des besoins. Enfin, nombreuses sont les opportunités liées à l’accès, au volume et à la nature des données pour les gouvernements à travers la santé, la sécurité, le climat, l’urbanisme, les médias, l’emploi et autres domaines qui structurent profondément une société, voire les relations internationales.

La « création de valeur » – dont le concept est à interroger – semble se dégager à travers les approches de ces différents domaines, mobilisant des enjeux d’innovation  et de nouvelles opportunités économiques. La disponibilité de données massives conduit à appréhender des métriques différentes, à considérer des corrélations inédites de données et à développer les modèles « prédictifs ». Pour la recherche, le défi consiste à construire, partager et vérifier des preuves scientifiques supplémentaires, à réutiliser les données et à en extraire de nouvelles hypothèses.

Cependant, si ces challenges de l’Open Data et du Big Data sont plébiscités par de nombreux acteurs, ils impliquent néanmoins un ensemble de problématiques sensibles vu leur transversalité, leur ampleur et leur impact social potentiel. L’une des questions principales au centre des débats reste la protection des données personnelles. Qu’il s’agisse d’informations réelles sur un individu (son identité, le résultat de son travail, ses préférences, son comportement, son passé, ses besoins en temps réel, ses données de santé ou bancaires,…), ou d’informations virtuelles de son ombre numérique, les notions de propriété et de confidentialité des données restent centrales. Les discussions et réflexions en termes juridiques, citoyens, mais aussi commerciaux animent actuellement les débats en France notamment par  l’action de la CNIL, au sein de l’Union Européenne, à travers l’élaboration en cours d’une nouvelle directive européenne visant l’harmonisation des pratiques, et au Maroc avec la réalisation des premiers contrôles pour assurer la protection des données personnelles par la CNDP selon l’article 24 de la nouvelle Constitution[1] qui garantit le droit à la vie privée et le secret des communications. L’anonymisation des données ne semble pas aujourd’hui être une solution suffisante.

Qu’il s’agisse d’une rupture technologique comme le laissent entendre les discours de certains acteurs promoteurs d’un nouvel écosystème, d’une innovation en termes de modèles économiques et sociaux, d’une évolution de la performance des outils existants ou d’un simple effet de mode, ce phénomène transverse s’inscrit au cœur de nombreux travaux de recherche en sciences de l’information et de la communication, mais aussi en sciences de gestion, informatiques, sociales, et plus généralement les sciences dont les expérimentations quantitatives font appel à des volumes de données significatifs, comme la génomique, la météorologie, l’épidémiologie, la criminologie, etc.

Différents enjeux intéressant les Sciences de l’information et de la communication méritent d’être mis en perspective. Cette cinquième conférence « Document numérique et Société »  favorisera les observations et les retours d’expériences mais aussi les réflexions théoriques et critiques sur les modèles que le « Big Data » suscite  et plus particulièrement ceux qui renouvellent le champ des sciences de l’information et de la communication :

  1. Les enjeux techniques liés à la structuration et à la construction des connaissances : pour pouvoir être analysables, réutilisables, combinables, agrégeables, les données doivent être structurées. Le renforcement de la convergence des systèmes d’identification des ressources documentaires avec celles du web, la constitution de schémas de métadonnées, favorisent l’interopérabilité des systèmes et les calculs sur les données. Des études de cas relatant des retours d’expérience pourraient être intéressants aussi bien en provenance  des institutions publiques que des entreprises. En matière de construction de savoirs, quelles sortes de connaissances est-on susceptible de construire par le croisement des données ?
  2. Les enjeux sociétaux liés aux usages du « Big Data ». Les stratégies d’ouverture et de partage des données ne renouvellent-elles pas une forme de dictature de la transparence en revendiquant un « changement de culture » basé sur l’abandon de la protection des données personnelles ? Tant les comportements que développent les usagers face à l’exploitation de leurs données que les régulations et les réglementations à envisager devraient être examinés.
  3. Les enjeux industriels et professionnels : on peut s’interroger sur le profil des organisations tirant déjà profit de cette ouverture, sur le poids des géants du web dans la redistribution de la valeur. Des compétences spécifiques apparaissent nécessaires pour travailler les données : s’agit-il d’une acculturation générale au datamining ? Quelles spécialisations pour les « nouveaux » métiers tels les data-journalistes, data-scientifiques ?
  4. Les enjeux épistémologiques liés au renouvellement des cadres d’analyse et d’inter­prétation, les nouvelles métriques, les nouveaux modèles d’affaires, seront également à mettre en perspective.

Sont concernées par ce colloque les recherches théoriques et expérimentales qui s’inscrivent dans la perspective des études sur le phénomène du Big Data en termes d’enjeux pour nos sociétés et de création de valeurs. Sans être limitatives, voici quelques thématiques sur lesquelles pourraient porter les communications des auteurs :

  • Nouveaux rôles pour les bibliothécaires et documentalistes (data scientist, digital curation librarian, data manager…)
  • Data-journalisme
  • Applications du « Big Data » notamment dans  le domaine de l’intelligence compétitive
  • Big Data et open governement
  • Big Data et open science : impact sur la recherche scientifique
  • Cadre juridique du Big Data (protection des données personnelles, copyright, droits d’auteurs
  • Comportement des usagers face à l’open data, le big data
  • Ethique informationnelle
  • Innovation de services et open data
  • Data-visusalisation
  • Tendances émergentes en sciences de l’information induites par le Big Data
  • Adaptation des normes et des standards (taxonomies, schémas de métadonnées…)
  • Management des données du SI (SIGB, dépôts institutionnels, plateformes d’e-learning)
  • Big data et pilotage des fonctions de l’entreprise
  • Epistémologie du big data…