Orélie Desfriches Doria soutiendra sa thèse intitulée La classification à facettes pour la gestion des connaissances métier, Méthodologie d’élaboration de FolkClassifications à facettes
Résumé long
Dans le cadre du projet ANR Miipa-Doc (Méthode et services Intégrés Institutionnels et Participatifs pour la Classification à Facettes des Contenus Documentaires Complexes) en partenariat avec EDF R&D, l’UTT (Université de Technologie de Troyes), l’entreprise Cogniva, et la JEU (Jeune Entreprise Universitaire) Sémiotag, nous avons développé une méthodologie d’élaboration de FolkClassifications à facettes pour la gestion des connaissances métier dans les organisations.
Mon rôle dans ce projeta consisté, en dialogue avec les développeurs, à définir les concepts qui structurent les principes des FolkClassifications à Facettes implémentés dans le prototype, et à articuler l’analyse des scénarios d’usage avec leur mise en œuvre dans l’Interface Homme-Machine.
Au commencement de cette recherche, nous nous sommes interrogés sur la pertinence de l’utilisation des classifications à l’heure où les moteurs de recherche sont largement déployés. Le savoir étant contenu en partie dans les documents, les questions d’organisation du savoir sont des questions d’accès au contenu du savoir, des questions de représentation et de description du contenu de ces documents. Ce sont ces fonctions que remplissent les Systèmes d’Organisation des Connaissances (SOC).
Traditionnellement, les classifications ont été des outils d’organisation du savoir. Dans le numérique, les moteurs de recherche sont largement déployés,mais les classifications transférées sous forme numérique restent utiles pour situer un sujet dans une discipline, et pour la découverte d’autres sujets. Elles ont une organisation systématique et prévisible que les moteurs ne peuvent pas proposer.Enfin, elles sont généralement construites par des experts du monde des bibliothèques ou de la documentation qui ont une bonne connaissance de leur fond documentaire.
Une organisation dispose en général d’un Système d’Information (SI) qui peut contenir un ou plusieurs SOC pour des visées différentes qui peuvent être la GED, l’archivage, la gestion personnelle de l’information, le travail collaboratif…Les SOC de nature institués, personnel et collaboratifs contribuent à l’activité de gestion de l’information, qui est un moyen pour la réalisation des missions des métiers de l’entreprise, et la pérennité de l’entreprise dépend de la bonne conduite de ces activités métier. Les approches traditionnelles des SOC sont dans une forme d’implicite de la portée des activités informationnelles sur les activités métier.
D’autre part, l’appropriation des SOC par les utilisateurs est difficile, elle nécessite des efforts de la part des utilisateurs, en termes d’apprentissage, d’acquisition d’une vision globale du SOC et de connaissance de la couverture du champ. Elle nécessite aussi des compromis sur le sens et l’usage des termes du SOC, en particulier l’apprentissage des conventions d’usage du SOC.
Des études démontrent que la cohérence entre plusieurs utilisateurs dans l’usage des SOC est peu satisfaisante. Ainsi, le classement ou l’ajout de métadonnées sont des activités qui impliquent des aspects interprétatifs, qu’il faut instrumenter, et l’activité d’utilisation d’un SOC est constituée d’une myriade de micro-décisions, sur lesquelles l’utilisateur doit arbitrer.
Les questions de recherche que nous avons traitées consistent donc à évaluer en quoi des caractéristiques spécifiques de dispositifs contributifs permettent de lever ces limites des SOC traditionnels, et sous quelles conditions un système basé sur la contribution et l’implication des utilisateurs dans sa conception peut contribuer à un cercle vertueux de la gestion de l’information.
La croissance de la quantité d’information numérique nécessite des outils de gestion qui se limitent souvent au système de gestion de fichiers, concernant les documents produits et utilisés dans le cadre de l’activité de travail (proto-documents). Les problématiques abordées dans ce travail, consistent, concernant l’indexation, à étudier les formes de conciliation de conceptions de Systèmes d’Organisation des Connaissances formels, institués (thésaurus, ontologies formelles), opposées en général aux conceptions folksonomiques et à celles issues du Web socio-sémantique. Il s’agissait aussi d’étudier quelles formes d’émergence de consensus terminologique sont possibles. Concernant la distinction entre travail réel et travail prescrit, nous avons travaillé sur les aspects imposés, négociés, individuels de la charge de travail liée à la gestion de l’information. Enfin, sur la tension entre travail individuel ou collectif, nous avons cherché quelles seraient les définitions des collectifs considérés, et quelles articulations des dimensions institutionnelles, organisationnelles, individuelles des activités de gestion de l’information sont possibles.
Selon nous, les SOC multidimensionnels permettent de représenter des éléments contextuels afin de guider l’interprétation du sens des termes insérés dans le SOC. Mais aucun objet numérique ne peut porter avec lui tous les éléments de son contexte. Il y a donc des choix à effectuer sur la pertinence des informations contextuelles qu’il est nécessaire de conserver, pour faciliter la recherche d’information et le travail d’appropriation ou de réappropriation d’un document.
Les cadres théoriques que nous avons mobilisés concernant l’organisation des connaissances sont composés de trois champs : nous avons exploré l’approche du Domain Analysisqui implique que la description du sujet d’un document devrait prendre en compte l’usage potentiel des documents. Selon cette approche, la pertinence de la description par sujet devrait être dirigée par la connaissance approfondie du domaine, des méthodes de recherche, ainsi que des besoins des utilisateurs cibles. Nous avons rapproché cette approche de Hjørland du projet du Web Socio-Sémantique qui vise à créer des ontologies basées sur les contributions d’utilisateurs distribués qui portent des points de vue. Enfin, nous nous sommes intéressés aux approches de Gestion des connaissances, notamment celles orientées-document.
Concernant l’analyse des activités métier et informationnelles, les théories que nous avons convoquées sont la théorie de l’Activité, qui nous a permis d’obtenir une grille de lecture de l’activité au sens large. Ensuite nous nous sommes intéressés à la Sémiotique des Transactions Coopératives (Zacklad), qui révèle la nature dynamique et transactionnelle des activités liées à l’information. Enfin, les approches de la psychologie du travail et de l’ergonomie françaises nous ont permis d’étayer notre approche orientée-utilisateur.
De ces approches issues de la psychologie du travail, et de l’ergonomie, nous avons pu mobiliser différents concepts, dont les suivants qui nous ont permis de développer notre point de vue : le sens du travail, les référentiels communs, et les activités métafonctionnelles, qui nous ont permis d’affirmer que l’activité de maintenance d’un système documentaire personnel, comme la réorganisation des dossiers d’une arborescence de fichiers, ou la construction, ou la maintenance d’un SOC, constituent une forme d’activité méta-fonctionnelle.
Dans le premier chapitre, nous présentons les problématiques liées à l’organisation des connaissances, à l’indexation par sujet, à la documentarisation, ainsi que les principes qui guident l’élaboration des classifications, des classifications classiques jusqu’aux classifications à facettes. Nous proposons ensuite une revue de la littérature sur les systèmes de tagging collaboratifs existants, notamment ceux qui offrent une structuration du système de tags à l’aide de facettes. Nous présentons enfin le projet ANR Miipa-Doc, dans le cadre duquel cette recherche a été menée.
Le deuxième chapitre est consacré à une synthèse des méthodes existantes d’élaboration de classifications à facettes. Ainsi, nous commençons par présenter celle de Ranganathan, qui a pour objectif le classement des livres dans une bibliothèque. Puis nous exposons la méthode du CRG (Classification Research Group) porté par Brian C. Vickery, pour des fonds bibliographiques spécifiques. Ensuite, nous poursuivons en présentant celle de l’entreprise Cogniva qui s’applique au Record Management dans les organisations. Enfin, nous décrivons la méthode de Denton (2003) basée sur les apports de Spiteri (1998) pour l’organisation des informations dans des sites Web.
Dans notre troisième chapitre, nous commençons par élaborer une typologie des Systèmes d’Information (SI), et nous poursuivons en réalisant une analyse de l’impact de ces types de SI sur l’activité de gestion de l’information. Les notions de contexte, de métier, d’activité, et de sens de l’activité, ainsi que le champ du PIM (Personal Information Management) sont explorées pour proposer une conception contextuelle de la structuration et de l’organisation des connaissances. Nous présentons de manière détaillée le prototype Hypertagging, développé dans le cadre du projet Miipa-Doc, en fin de ce chapitre.
Le quatrième chapitre est consacré à la présentation de notre expérimentation, réalisée avec deux Ingénieurs-Chercheurs de la R&D d’EDF, dont nous avons étudié les postes de travail individuels afin de proposer une classification à facettes pour la gestion de leurs documents de travail. Nous avons procédé à des entretiens individuels et en groupe pour tenter de comprendre leur activité afin d’élaborer une structuration de la classification à facettes basée sur les activités. Les hypothèses de travail sont présentées, et validées ou invalidées.
Dans notre cinquième et dernier chapitre, nous présentons notre méthodologie d’élaboration de la FolkClassifications à facettes pour la gestion des connaissances métier. Elle s’inspire des résultats de notre expérimentation et vise à appuyer une démarche de gestion des connaissances (orientée-document), sur la gestion personnelle de l’information dans son flux quotidien. Nous cherchons donc à proposer un modèle d’Organisation des Connaissances selon une approche contextuelle de la gestion de l’information (SOC multidimensionnels), intégrant une implémentation des principes de la classification à facettes, structuré par l’analyse des activités métier, pour des collectifs restreints (orienté-utilisateur), dans un IHM ergonomique qui vise à équiper les activités de gestion de l’information.
De futures expérimentations restent à mener pour la généralisation des résultats de recherche, tandis que la détermination des dimensions collaboratives des FolkClassifications à facettes, pourrait être outillée. Il apparaît nécessaire d’élaborer des critères d’évaluation de ce type de Système d’Organisation des Connaissances, tout en continuant à faire évoluer l’IHM du prototype.