Enjeux de l’indexation à l’heure de l’intelligence artificielle

Thématique : ditorialisation

Séminaire Dicen, thème Editorialisation, patrimonialisation, autorité

 9 mars 2022 14h00-17h00

 Modalité : présentiel + accès à distance

2 rue Conté

Salle 30-1-16 au 1er SOUS SOL dans le « bâtiment » au centre de la cour face au porche.

 

Programme  (les temps d’intervention comprennent les échanges avec la salle)

 

14h00-14h30 Evelyne Broudoux Indexation et autorité

14h30-15h15 Muriel Amar L’indexation comme une pratique (professionnelle) de construction publique du sens (titre provisoire)

De ce point de vue, l’indexation repose sur deux fondements linguistiques : la thématisation (construction des thèmes et nomination des thèmes) et la référenciation (accès par des mots à un univers de choses : on utilise des mots en indexation non pour ce qu’ils signifient mais pour leur capacité à désigner des choses – informations, documents, segments, ressources etc.).

Plusieurs manières de thématiser et de référencer conduisent à identifier deux types d’indexation, l’une lexicale l’autre discursive : ces deux types d’indexation sont saisis dans les pratiques en fonction des contextes documentaires (nécessité ou non d’intermédiaire humain et textuel notamment).

C’est le contexte documentaire (corpus clos/corpus ouvert, données massives, données sélectives, etc.) qui pèse sur le choix d’un type d’indexation (humaine, automatique, mixte ; lexicale ou discursive dans la typologie que je propose).

Dans tous les cas de figures, un travail de petites mains, dont le caractère invisible et inachevé, collectif et donc peu identifiable fait partie de la réussite…

 

Pause

15h30-16H00 Claire Scopsi Donner accès aux captations des procès  filmés des attentats du 13 novembre 2015 : indexation ou intelligence artificielle ?

Le contexte légal des procès filmés et les caractéristiques du procès dit « des attentats du Bataclan » (9 mois de procès, 7 caméras). Volumétrie des captations et problématique des points d’accès aux Archives Nationales et les raisons du choix d’une indexation manuelle. Le dispositif d’indexation mis au point avec Annotate, et son articulation avec une éventuelle opération de reconnaissance automatique de la parole.

16h00-16h15 Gilles Bertin : Annoter les partitions de la Bnf avec Annotate.

Présentation des annotations internes aux partitions numérisées de la Bnf avec Annotate. L’objectif est de produire des corpus annotés pour l’apprentissage profond de la reconnaissance automatique des partitions.

16h15-17h00 Romain Bigay : Le taggage collaboratif des webradios musicales (sujet provisoire)