Atelier pratique sur l’usage des ressources ISTEX [Toulouse]

Atelier pratique sur l’usage des ressources ISTEX [Toulouse]
Date: 
21 Novembre 2019
Durée: 
6 heures
Horaires: 
9h30 - 17h
Thématique: 
Traiter : réseaux et outils, outils et techniques de gestion documentaire, traitement, analyse, indexation et cartographie de l'information
Formateur: 
Camille de SALABERT
Sabine BARREAUX
Maxime RAGOT
Objectifs: 

La plateforme ISTEX propose un accès à une collection pluridisciplinaire de 22 millions de documents pour l’ensemble des établissements de l’enseignement supérieur et de la recherche (ESR) français.

Les ressources sont réparties en 24 corpus rassemblant plus de 250 éditeurs scientifiques et ont été acquises sans date limite d’accès et d’exploitation.

Le développement de modèles d’apprentissage automatique a permis d’enrichir et d’uniformiser l’ensemble des ressources afin d’interroger très finement l’intégralité de la base. À ce réservoir inégalé s’ajoute des services aux utilisateurs permettant d’en optimiser l’exploitation grâce à des outils de visualisation interactive et de fouille de contenus (TDM).

Les ateliers ISTEX permettront aux participants la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique. Ces ateliers ont pour objectif de renforcer la communauté  d’utilisateurs des ressources ISTEX  et d’éveiller les pratiques documentaires vers la fouille de textes et de données.

Contenu: 

• Matin : construire et valoriser un corpus spécialisé à partir du réservoir ISTEX
30min de présentation sur ISTEX et 2h30 de travaux pratiques. Matinée animée par Camille de salabert et Sabine Barreaux de l'INIST.

Les participants pourront découvrir  les outils et services ISTEX et s’approprier  les méthodes de constitution et d’exploration de corpus à travers des exemples de corpus réalisés par l’INIST.

Après une présentation d’ISTEX, cet atelier se déclinera en 3 modules :

Interrogation d’ISTEX pour constituer un corpus
Construction d’une requête avec le démonstrateur
Affiner la requête pour limiter les étapes de post-traitement des résultats
Extraction du corpus
Utilisation du service de téléchargement ISTEX-DL
Exploration, analyse et partage d’un corpus
Utilisation du service de visualisation Lodex

A l’issue de cet atelier, les participants sauront interroger la base ISTEX pour construire, télécharger et explorer leur propre corpus.

Après-midi : Explorer un corpus documentaire ISTEX à l’aide de l’outil de cartographie Cillex

Intervenant : la formation de l'après midi est animée par Maxime Ragot de la direction de l'information scientifique et technique (Dist) du CNRS.

L’outil Cillex est conçu pour produire des cartes dynamiques référençant les métadonnées d’une requête à l’API Istex. Cette cartographie permet de choisir les métadonnées d’intérêt en fonction du type de recherche (par thématique, par auteur, etc.). Cartographie Cillex : outils de visualisation du corpus documentaire Istex. Vidéo de présentation

Ecosystème Istex : le chantier d’usage Cillex
Manipulations basiques de l’interface
Usage avancé :

Traitement des données sur un tableur
Affiner la sélection documentaire
Visualiser les métadonnées d’intérêt

Ouverture vers Gargantext : comparatif des 2 outils (quel outil pour quels besoins?)

En savoir plus sur Istex : Maurel, Denis, Enza Morale, Nicolas Thouvenin, Patrice Ringot, and Angel Turri. 2019. ‘Istex: A Database of Twenty Million Scientific Papers with a Mining Tool Which Uses Named Entities’. Information 10 (5): 178. https://doi.org/10.3390/info10050178.

Pré-Requis: 

En amont de la formation, les participants devront avoir pris connaissance de quelques tutoriels de l’Inist pour se familiariser avec ISTEX, comprendre les différents formats de documents, assimiler le vocabulaire et s’approprier les bases du langage d’interrogation de l’API

Tarif: 
250 €

Rappel : les stages sont gratuits pour tous les personnels d’établissements d’enseignement supérieur et de recherche, ainsi que pour les doctorants.