L’intelligence artificielle a envahi le monde des affaires, annonçant des bouleversements dans l’aide à la décision. C’est une nouvelle brique dans l’ensemble des composants informationnels que toute organisation doit intégrer ou, à tout le moins, prendre en compte. La mise en place du règlement général sur la protection des données (RGPD) en Europe en 2018 et ses équivalents dans les autres pays ou continents ont mis en lumière la difficulté et l’enjeu d’une bonne gouvernance de l’information au sein de toutes les organisations. Dans cet article, nous confrontons ces deux éléments de la nouvelle donne : l’intelligence artificielle et la gouvernance de l’information. Après avoir rappelé ce qu’est cette gouvernance, nous aborderons les deux facettes de la confrontation : comment la gouvernance de l’information doit prendre en compte les outils d’intelligence artificielle, consommateurs et producteurs d’une information à gouverner ? Comment ces mêmes outils peuvent-ils aider l’organisation dans sa gouvernance des données et de l’information ?
1. Qu’est-ce que la gouvernance de l’information ?
La gouvernance de l’information désigne la mise en place, au sein d’une entreprise ou d’une organisation, d’une politique de management de l’information, avec des objectifs définis et une mise en œuvre planifiée, incluant des moyens humains, organisationnels et technologiques. Les termes de gouvernance des données et gouvernance de l’information sont utilisés, souvent comme synonymes ou variantes, pour désigner cette stratégie de pilotage des actifs informationnels. Préférer l’expression gouvernance des données permet d’attirer l’attention sur l’aspect digital du sujet, mais présente le risque de limiter la réflexion aux données purement structurées. La gouvernance de l’information ou gouvernance des informations englobe elle aussi les données, quelle que soit leur forme, données structurées dans des tables, données semi-structurées dans des documents ou données moins structurées dans les logiciels de messagerie ou sous forme d’image. Finalement, la gouvernance de l’information peut être définie par son objectif : maximiser la valeur de l’information en minimisant les coûts et les risques associés.
La gouvernance de l’information a en charge un ensemble de processus-clés, parmi lesquels le management de la qualité des données ou encore leur sécurité (disponibilité, intégrité, confidentialité, mais aussi traçabilité). Même s’ils s’appuient sur des solutions informatiques, ces processus sont souvent, à juste titre, sous la responsabilité des métiers.
La gouvernance de l’information est pertinente dans tous les domaines et secteurs d’activité. Elle prend plus d’acuité là où les trois dimensions complémentaires de valeur, coût et risque sont prégnantes. Prenons par exemple le secteur de la banque où le coût de gestion de l’information peut représenter plus de 10 % du chiffre d’affaires et le risque associé est important du fait par exemple de la manipulation d’une information très particulière qu’est l’argent sous forme électronique ! Dans le secteur de la santé, c’est la dimension risque — de divulgation ou d’erreur — qui prime, sans pour autant que l’on puisse occulter les autres dimensions.
La gouvernance de l’information s’organise de mieux en mieux dans les entreprises publiques et privées, et plus largement dans toutes les organisations. Ces dernières montent en maturité sur le sujet, comme l’indiquent certaines études. Pour autant, elle doit faire face constamment à de nouveaux défis, l’intelligence artificielle en est un.
2. L’intelligence artificielle, une information bien particulière à gouverner
Pour comprendre, décider, apprendre, les outils d’intelligence artificielle emmagasinent des données ou des informations. Ces dernières sont de plus en plus volumineuses et variées. Elles doivent, comme toutes les informations de l’entreprise, être sous contrôle, et c’est un des aspects importants de la gouvernance de l’information. Qu’il s’agisse d’entrepôts de données, de lacs de données, ou tout autre réservoir d’information, rien ne doit échapper à la cartographie de l’information et s’inscrire dans les trois dimensions de valorisation, de gestion des risques et de contrôle des coûts.
La qualité des données prend tout son sens : elle doit faciliter l’utilisation de l’intelligence artificielle, en mettant à disposition des processus de collecte, de repérage et de nettoyage des données.
Au-delà de ces aspects classiques de la gouvernance des données, l’intelligence artificielle soulève de nouvelles questions comme celle des biais humains présents tant dans les algorithmes que dans les données et qui peuvent conduire à de mauvaises décisions. Outre le repérage des données personnelles et, plus généralement, des données sensibles, le référencement des informations issues de l’intelligence artificielle doit aussi intégrer une description du fonctionnement de ces algorithmes.
C’est tout l’enjeu de l’IA explicable (en anglais, explainable AI) qui désigne les méthodes permettant d’équiper les boîtes noires de l’intelligence artificielle de modules expliquant, au moins partiellement, les résultats fournis. C’est un enjeu réglementaire dans de nombreux cas, c’est aussi un enjeu de confiance afin de permettre aux utilisateurs des informations ou conclusions de l’intelligence artificielle de s’appuyer sans réticence sur cette aide précieuse. Enfin, c’est un enjeu d’éthique pour les organisations qui sont ainsi en mesure d’assurer une transparence de leurs processus, même quand ceux-ci ont recours à des outils d’intelligence artificielle.
L’intelligence artificielle au service de la gouvernance de l’information
À l’inverse, les outils d’intelligence artificielle peuvent aussi se révéler une aide précieuse pour la gouvernance de l’information.
Ainsi, la cartographie de l’information doit, entre autres, repérer partout les données personnelles pour assurer la conformité au RGPD. L’intelligence artificielle peut aider à relever le défi de la maintenance de cette cartographie, tâche fastidieuse, mais non triviale, qui requiert des capacités d’analyse et de prise de décision. Le volume et l’omniprésence des données rendent cette tâche impossible à assurer manuellement.
L’homme va rester maître de cet écosystème qu’est la gouvernance de l’information, mais l’intelligence artificielle et d’autres technologies émergentes, comme la blockchain, vont jouer un rôle très important d’assistance pour analyser les informations et assurer la conformité. L’automatisation peut concerner aussi l’archivage et la destruction de l’information, phase ultime du cycle de vie, là encore pour répondre tant aux obligations réglementaires qu’aux besoins d’efficacité.
Les éditeurs de logiciels spécialisés dans la gouvernance des données disent avoir intégré l’intelligence artificielle dans leur palette de composants même s’il reste difficile d’en évaluer la portée. Certains utilisent des techniques intelligentes pour repérer les nouvelles données, identifier les liens entre elles, classifier les documents. Les techniques d’apprentissage permettent de décrire des contenus types que le logiciel devient capable de reconnaître après un entraînement suffisant. Parmi les techniques relevant de l’intelligence artificielle, le traitement du langage naturel, la reconnaissance automatique de caractères continuent à s’améliorer de plus en plus. Les robots logiciels exécutent des tâches répétitives, repèrent par exemple des factures dans un ensemble de documents administratifs, fournissant ensuite à l’expert humain une analyse qu’il n’a plus qu’à confirmer, à l’image du chèque traité automatiquement dans tous les guichets automatiques des banques.
Là aussi, une intelligence artificielle explicable sera de nature à aider l’organisation à faire la preuve de sa bonne gestion de l’information pour faire face à la réglementation ou pour instruire une demande de vérification. Finalement, face à la réglementation qui évolue elle aussi et qui varie d’un pays à un autre, en présence d’informations de plus en plus riches et variées, la gouvernance de l’information a aussi beaucoup à gagner en recourant aux outils de l’intelligence artificielle.