Présentation

Ce webinaire sera consacré au Text and Data Mining. La fouille de texte et de données à des  fins de recherche a été transposée dans le droit français en décembre 2021. Cette évolution a permis d'ouvrir de nouvelles perspectives pour la recherche, en permettant notamment de reproduire des contenus protégés par des droits de propriété intellectuelle sans avoir à recueillir d’autorisation préalable des « titulaires de droits » dans le cadre d'un projet de recherche. Cette « exception » a provoqué débats et controverses mais a également permis le développement de nouveaux usages. Après un rappel de l'historique et du contexte juridique, deux chercheurs présenteront leurs projets basés sur le TDM. Explorons ensemble les cités enfouies ! Ce webinaire est organisé par le GTSO Données du Consortium Couperin.

Ce webinaire est préparé par Laetitia Bracco (Université de Lorraine), Delphine Du Pasquier (École des Ponts ParisTech), Cyril Heude (Sciences Po Paris), Doriane Lemeltier (CEA Saclay), Léa Mosnier (Aix-Marseille Université), Cynthia Pedroja (Campus Condorcet) et Jozefina Sadowska (INRIA).

Mercredi 21 juin 2023 de 10h à 12h

INSCRIPTION

 Ce webinaire sera enregistré puis diffusé sur la chaine Youtube du GTSO-Données.

Programme

Le cadre juridique européen du Text and Data Mining

Julien Baudry

Le TDM est une pratique encadrée juridiquement en tant qu'exception de la propriété intellectuelle, puisque majoritairement exercée sur du contenu sous droit. Nous verrons ce que la loi autorise ou non, et quelles difficultés d'interprétation peuvent se poser aux chercheurs sur le terrain.

 

Logiciel CorText Manager - Extraction d’information et analyse socio-sémantique pour les sciences humaines et sociales

Lionel Villard

CorTexT Manager est une application web construite par des chercheurs et par des ingénieurs à destination de chercheurs en sciences humaines et sociales, au plus près des questions portées par les chercheurs qui nous entourent et par notre communauté d’utilisateurs.

Cette application web peut produire un grand nombre d’analyses différentes qui ont trait aux champs méthodologiques du traitement automatique de la langue, de l’analyse des réseaux sociaux, de la statistique, et plus récemment autour de la dimension géographique qui se cache dans ces données.

Un des points forts de Cortext Manager est de pouvoir traiter plusieurs dimensions d’analyse en les combinant dans le même espace. Cet aspect hétérogène permet par exemple d’associer le temps avec la dimension sociale, de l’analyse de texte avec la dimension sociale ou géographique. Cela permet d’appréhender l’émergence de domaines de recherche et d’innovation, d’étudier des controverses et "hot topics", d’effectuer des cartographies socio-sémantiques des productions de la recherche (publications, brevets, projets), ainsi que d’analyser des contenus issus du web et des média-sociaux.

 Cet atelier se propose de sensibiliser l’audience à certaines de ces méthodes tout en découvrant l’organisation et l’évolution de la production scientifique autour de la chloroquine et de l’hydroxychloroquine entre 2014 et 2020.

 

 Analyse des récits médiatiques sur l'IA

Maxime Crépel

L'IA a connu une couverture médiatique croissante ces dernières années. A partir de corpus d'articles de presse portant sur l'IA et les algorithmes, nous proposons une analyse des discours que les médias produisent sur ces technologies de calcul. Nos travaux mettent en évidence les domaines et les enjeux associés à ces technologies, ainsi que le cadrage médiatique articulant des discours de promesses et de critiques sur l'impact de l'IA dans la société. Notre présentation se centrera principalement sur le protocole méthodologique et les outils déployés pour effectuer ces analyses.

Intervenants

Julien Baudry est conservateur des bibliothèques au Service Commun de la Documentation de l'Université Bordeaux Montaigne, en charge du pôle Collections Remarquables et Patrimoine Scientifique. Au sein du GTSO, il anime le groupe de travail dit "juridique", dont la mission est d'éclairer l'application sur le terrain des lois et règlements liés à la Science Ouverte.

 

Lionel Villard est enseignant chercheur ESIEE-Paris, chercheur au LISIS et responsable de la plateforme CorText. Ses recherches portent sur la fouille de données, la scientométrie et la visualisation de données, et traitent des agglomérations géographiques et de la dynamique des connaissances dans le développement de domaines de haute technologie (par exemple, les nanotechnologies et les biotechnologies).

 

Maxime Crépel est ingénieur de recherche au médialab de Sciences Po. Ses travaux de recherche associent des méthodes qualitatives et numériques et portent sur les usages de différents dispositifs techniques tels que le Web, le mobile, l'IA et les algorithmes.

Personnes connectées : 2 Vie privée
Chargement...