Atelier pratique sur l’usage des ressources ISTEX [Montpellier]

Disponible
Atelier pratique sur l’usage des ressources ISTEX [Montpellier]
Date: 
23 Janvier 2020
Durée: 
6 heures
Horaires: 
9h30 - 17h
Thématique: 
Traiter : réseaux et outils, outils et techniques de gestion documentaire, traitement, analyse, indexation et cartographie de l'information
Formateur: 
Maxime RAGOT
Camille de SALABERT
Pascale VIOT
Objectifs: 

La plateforme ISTEX propose un accès à une collection pluridisciplinaire de 22 millions de documents pour l’ensemble des établissements de l’enseignement supérieur et de la recherche (ESR) français.

Les ressources sont réparties en 24 corpus rassemblant plus de 250 éditeurs scientifiques et ont été acquises sans date limite d’accès et d’exploitation.

Le développement de modèles d’apprentissage automatique a permis d’enrichir et d’uniformiser l’ensemble des ressources afin d’interroger très finement l’intégralité de la base. À ce réservoir inégalé s’ajoute des services aux utilisateurs permettant d’en optimiser l’exploitation grâce à des outils de visualisation interactive et de fouille de contenus (TDM).

Les ateliers ISTEX permettront aux participants la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique. Ces ateliers ont pour objectif de renforcer la communauté  d’utilisateurs des ressources ISTEX  et d’éveiller les pratiques documentaires vers la fouille de textes et de données.

Contenu: 

• Matin : construire et valoriser un corpus spécialisé à partir du réservoir ISTEX
30min de présentation sur ISTEX et 2h30 de travaux pratiques

Intervenants : Pascale VIOT et Camille DE SALABERT (Inist)

Les participants pourront découvrir  les outils et services ISTEX et s’approprier  les méthodes de constitution et d’exploration de corpus à travers des exemples de corpus réalisés par l’INIST.

Après une présentation d’ISTEX, cet atelier se déclinera en 3 modules :

Interrogation d’ISTEX pour constituer un corpus
Construction d’une requête avec le démonstrateur
Affiner la requête pour limiter les étapes de post-traitement des résultats
Extraction du corpus
Utilisation du service de téléchargement ISTEX-DL
Exploration, analyse et partage d’un corpus
Utilisation du service de visualisation Lodex

A l’issue de cet atelier, les participants sauront interroger la base ISTEX pour construire, télécharger et explorer leur propre corpus.

Après-midi : Exploration d’un corpus documentaire ISTEX à l’aide de l’outil de cartographie Gargantext
30 min de présentation de Gargantext et 2h30 de travaux pratiques

Intervenant : la formation est animée par Maxime Ragot de la direction de l'information scientifique et technique (Dist) du CNRS.

L’outil Gargantext est conçu pour produire des cartes interactives qui évoluent au fur et à mesure que vous travaillez dessus. Ces cartes thématiques de mots peuvent être utilisées pour construire un état de l’art en cartographiant un ensemble de documents,  et mettant en place une représentation collective d’un questionnement, etc.

La carte n’est pas l’objectif final mais une étape intermédiaire qui se conçoit comme support pour créer une représentation adaptative d’une question ou d’un problème en permettant des allers/retours entre les différents niveaux de vos corpus (document, termes, cartes, etc.).

Cartographie Gargantext : expérimentation de Gargantext sur le corpus ISTEX
Tutoriel : réalisation de sa première carte

Le projet EasISTEX : expérimentation de Gargantext sur le corpus ISTEX
Présentation des bases de données
Manipulations basiques de l’interface
Usage avancé : Comment améliorer une carte
Présentation de la version 4 de Gargantext

Ressources :

En amont de la formation, les participants devront avoir pris connaissance de quelques Tutoriels de  l’Inist pour se familiariser avec ISTEX, comprendre les différents formats de documents, assimiler le vocabulaire et s’approprier les bases du langage d’interrogation de l’API :

Module 1 :  Comprendre ce qu'est l'API ISTEX : A quoi sert-elle ? Pour qui ?
Module 2 :  Apprendre à interroger l'API ISTEX Part 1 (jusqu’à la syntaxe Lucène de base)

En savoir plus sur Istex : Maurel, Denis, Enza Morale, Nicolas Thouvenin, Patrice Ringot, and Angel Turri. 2019. ‘Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities’. Information 10 (5): 178. https://doi.org/10.3390/info10050178.

 

Pré-Requis: 

En amont de la formation, les participants devront avoir pris connaissance de quelques tutoriels de l’Inist pour se familiariser avec ISTEX, comprendre les différents formats de documents, assimiler le vocabulaire et s’approprier les bases du langage d’interrogation de l’API

Tarif: 
250 €

Rappel : les stages sont gratuits pour tous les personnels d’établissements d’enseignement supérieur et de recherche, ainsi que pour les doctorants.