Publication scientifique


L’avenir des grands graphes pour la gestion des données numériques

Dans un article paru dans ACM communications en Septembre 2021, des chercheurs en informatiques ébauchent l’avenir des modèles de graphes face à l’exploitation croissante de données numériques toujours plus complexes et interconnectées.

Dans une société en pleine transformation numérique, la gestion des données numériques est un devenu enjeu économique et sociétal majeur. Parmi les systèmes d'analyse de big data, les modèles de graphes sont la technologie la plus utilisée.

Les graphes constituent un outil puissant permettant de révéler des relations fortes entre informations. Ils sont à la base du succès incontesté des moteurs de recherche Google au milieu des années 90 et sont aujourd’hui utilisés dans des domaines extrêmement variés. Mais avec le boom du big data, les sources de données numériques sont de plus en plus diversifiées : données textuelles, relationnelles, graphiques…

Aujourd’hui, il est indispensable de connecter davantage ces différents types d’informations. A l’instar du projet « Graphs 4 Covid-19 », qui permet aux experts scientifiques d’exploiter des informations liées à la pandémie Covid-19 (publications, brevets, données biologiques, informations sur les traitements et les vaccins…). Mais « les processus et requêtes exécutés aujourd'hui sur les graphes Covid-19 restent très simples », reconnait Angela Bonifati, Professeure à Lyon 1 et chercheuse au Laboratoire d'Informatique en Image et Systèmes d'information (LIRIS – CNRS / INSA Lyon / Université Claude Bernard Lyon 1 / Université Lumière Lyon 2 / École Centrale de Lyon).

Au-delà de l’exemple de la Covid-19, l’exploitation croissante, dans de nombreux domaines de la recherche et de l’industrie, de données numériques interconnectées nécessite le développement de traitements des graphes plus avancés.

Dans une publication parue dans la prestigieuse revue scientifique ACM communications, un groupe international de scientifiques ébauche ainsi l’avenir des grands graphes. L’objectif : « automatiser la gestion et l’analyse de données graphes, sur n’importe quel jeu de données explique » Angela Bonifati, qui figure parmi les premiers auteurs de l’article.

Pour réaliser ces tâches complexes, de nouvelles architectures de référence et de nouveaux centres de calcul pour ces données restent à élaborer. Les scientifiques identifient trois caractéristiques indispensables qui devront être au cœur des futures recherches en informatique :
 

  • L’abstraction, utilisée dans les systèmes informatiques, les langages de requêtes et les modèles de données, pour dissimuler les aspects techniques et faciliter l’expérience utilisateur ;
  • L’architecture, un écosystème intégrant toute la complexité des données pour le traitement des grands graphes ;
  • La performance, pour l’exécution d’une application dans des temps acceptables pour l’utilisateur.
     
Dans ce contexte, l’équipe d’Angela Bonifati au LIRIS se positionne fortement sur les axes abstraction et architectures. A l’instar de la chercheuse qui vient de reçevoir un financement ANR avec le projet VeriGraph, pour la conception et la spécification formelle d'un nouveau langage standard d'interrogation à utiliser dans les systèmes de gestion et d'analyse de grands graphes.

Par cet article, les signataires espèrent que, dans les prochaines années, le développement de nouveaux centres de calculs sera basé sur cette architecture intégrée, qui répondra aux besoins de domaines d’applications pour les grands graphes tels que le calcul scientifique, l’intelligence décisionnelle ou l’intelligence artificielle.

 
Source
Sakr, S., Bonifati, A., Voigt, H., Iosup, A., Ammar, K., Angles, R., ... & Yoneki, E. (2021). The future is big graphs: a community view on graph processing systems. Communications of the ACM, 64(9), 62-71.
doi : 10.1145/3434642
 
Contact scientifique
Angela Bonifati, Professeure à l’Université Claude Bernard Lyon 1, Chercheuse en Bases de données et Systèmes pour le big data, Responsable de l’équipe Bases de Données au LIRIS, Responsable du Thème Big Data à la Fédération Informatique de Lyon.
Mail : angela.bonifati@univ-lyon1.fr | tel : +33-4-72-44-58-24
Publié le 13 septembre 2021