BigData, IA et la Science Ouverte

Extrait du rapport en page 10 : « le développement de l’IA se fait dans un contexte technologique marqué par la « mise en données » du monde (datafication), qui touche l’ensemble des domaines et des secteurs ».

Depuis la parution du rapport de Cédric Villani « Donner un sens à l’Intelligence Artificielle » en Mars 2018 dans le cadre de la Stratégie Nationale de Recherche en Intelligence Artificielle du Ministère de l'Enseignement Supérieur, de la Recherche et de l'Innovation, les incitations à la mutualisation et à l’ouverture des données et ressources numériques se sont multipliées tant dans le cadre de la Recherche que dans celui de l'Industrie.

 

Nous pouvons relever les nombreux enjeux qui en découlent :

Enjeux scientifiques

Quelque soit la discipline, les données sont une source de production de nouvelles connaissances et de progrès, mais le processus pour arriver à ces résultats nécessite la proposition/appropriation de standards, la préparation et le partage des données à des fins d’analyse par des approches d’IA mais également pour la recherche en IA et plus généralement en Science des Données.

Enjeux économiques

Les innovations attendues constitueront un levier de croissance économique prometteur pour ceux qui les développeront ; la stratégie nationale de recherche en France avec l’appel du PIA3 pour des Instituts Interdisciplinaires d’Intelligence Artificielle (les 3IA) en Mars 2018 a mis en synergie Recherche-Formation et Entreprises afin d’accélérer la valorisation de ces recherches et la formation au sein de notre économie française.

Enjeux réglementaires

Le Plan National de la Science Ouverte annoncé par Madame la Ministre de l’Enseignement Supérieur, de la Recherche et de l’Innovation en Juillet 2018 et les exigences européennes et nationales en termes de définition de plans de gestion de données pour les projets de recherche s’imposent au monde académique dans le respect du Règlement Général de la Protection des Données (RGPD) et de la Protection du Patrimoine Scientifique et Technique (PPST).

Enjeux structurels et techniques

Depuis plusieurs années, la communauté académique rassemblée autour d’initiatives telles que la Research Data Alliance (RDA), l’European Open Science Cloud (EOSC), mais aussi au sein de nos organismes et instituts nationaux, organise des infrastructures de partage et d’archivage, des processus de labellisation, de certification et d’adoption de normes et standards pour les données de la recherche (HAL, W3C, principe FAIR « Facile à trouver, Accessible, Interopérable, Réutilisable »…).

 


Cet ensemble constitue un puissant moyen pour remplir de grandes missions publiques, répondre aux futurs programmes de l’Horizon Europe et aux 17 Objectifs de Développement Durable de l’ONU (ODD).

La région Occitanie, comme bien d’autres, possède des atouts majeurs en matière de production et d’exploitation de données, en particulier des données de la recherche, et peut s’affirmer aux niveaux national, européen et international comme « autorité » de données de qualité répondant aux principes FAIR. Le consortium Occitanie Data contribue au développement d’une IA éthique et responsable en Région Occitanie.

La recherche de l’Université de Toulouse organisée autour de ses six pôles de recherche est déjà engagée dans cette dynamique avec le 3IA ANITI, ses pôles de Très Grandes Infrastructures de Recherche telles que HumaNum, PROGEDO, Data Terra, le GIS Genetoul, ses Ecoles Universitaires de Recherche (telles que NEXT, …), ses LabEx (tels que SMS, CIMI, …) et sa stratégie scientifique partagée.