Petit-déjeuner du 12 octobre 2011 : « Les réseaux bayésiens pour la modélisation des risques »

article PdJ le 9 mars 2012 Aucun Commentaire

Par Catherine-Antoinette Raimbault, ARM, Vice-Présidente du CARM

D’après l’intervention de Patrick NAIM, ARM, Président du CARM, Elseware,
Petit-déjeuner du CARM du 12 octobre 2011.

Les réseaux bayésiens s’inscrivent dans la mouvance des réseaux de neurones, de l’intelligence artificielle, du data mining. Ils réconcilient connaissance, incertitude et probabilité. La notion de risque est du domaine de l’incertain, seule la perception que l’on a de ce risque ou sa matérialisation permet de le mesurer. Dans un contexte plus technique seule la connaissance permet de percevoir les risques. Le risque, ou probabilité d’un dommage, va ainsi ‘naviguer’ entre l’incertain et le déterminisme.

Mais on ne peut pas parler de risque sans modèle. Qu’est ce qu’un modèle ? Un modèle est la représentation d’une connaissance à un instant donné. ‘La perception du risque est un modèle de sa matérialisation possible’.

Un réseau bayésien est à la fois un modèle graphique de représentation qualitative des connaissances – dans sa phase de construction il intègre les connaissances d’experts en représentant ces connaissances et les liens de causalité des différentes variables par des graphes (graphe causal reliant causes et effets) –  ainsi qu’un système de calcul des probabilités conditionnelles – on fait appel dans une seconde phase à l’analyse statistique pour prévoir l’évolution de ces variables.

Thomas Bayes, mathématicien et pasteur anglican, dont l’ouvrage ‘Essay towards solving a problem in the Doctrine of changes’ fut publié à titre posthume en 1763, définit la notion de probabilité conditionnelle. Il met ‘en évidence le fait que la probabilité d’un évènement à venir et incertain dépend du niveau d’information dont on dispose avant la survenue de cet évènement. Cette notion est fondamentale car elle exprime le fait que l’incertitude est spécifique à chacun en fonction de son niveau de connaissance et est donc plus proche d’une croyance que d’une fréquence’. Selon le théorème de Bayes cette probabilité est révisable au fur et à mesure que son information est révisable : P (X/i). La notion de croyance prend le pas sur la notion d’objectivité.

Pierre-Simon de Laplace publiait en 1812 sa Théorie Analytique des Probabilités et infirmait également que ‘l’assurance de celui qui ne connait que les fréquences est bien plus faible que celle de celui qui maîtrise les ‘lois’ de la nature’.

L’intérêt des réseaux bayésiens va résider dans le fait qu’ils prennent en compte l’incertitude dans le processus d’analyse et de raisonnement, et donnent ainsi la possibilité d’agir dans un environnement incertain.

Un réseau bayésien permet d’analyser, d’exploiter des quantités importantes de données pour obtenir des connaissances utiles pour : prendre des décisions, faire des diagnostics, contrôler un système, simuler le comportement d’un système …

Ses domaines d’application se révèlent ainsi illimités ; à titre d’exemple, dans le médical (aide au diagnostic médical, localisation de gènes), la finance (scoring), le marketing (data mining), l’industrie (sûreté de fonctionnement, stratégie de maintenance …), la gestion des risques (analyse de risques), etc.

Prenons l’exemple d’un atelier de menuiserie et le risque d’accident pour un opérateur.

Pour construire un modèle de risque avéré, on introduit un niveau de connaissance ; dans le cas présent les deux facteurs de risque seront l’expérience de l’opérateur et la complexité de la machine ; à ces deux variables subsiste toujours une part d’aléa. On va décrire les relations causales entre les différentes variables par un graphe causal probabiliste, le graphe définissant la structure de la connaissance et les probabilités l’aléa.

Pour la prise en compte des décisions on rajoute dans ce nouveau graphe ou diagramme d’influence des nœuds de décision et des nœuds d’utilité: le fait de former les opérateurs, ce qui va améliorer le niveau des opérateurs, mais qui engendre un coût de formation et le choix d’un fournisseur de machines, ce qui détermine la complexité de la machine, dont il faut supporter le coût. On obtient ainsi le coût du risque qui est égal à la somme des coûts des décisions et des coûts liés aux accidents. Le diagramme d’influence a donc bien intégré les aspects économiques.

Par conséquent rajouter des probabilités conditionnelles permet une évaluation quantitative de l’impact sur la probabilité d’accident et le coût. On peut réduire ainsi les actions extrêmes.

Généralisation de cette approche par le modèle XSG

On y introduit la notion de base de Vulnérabilité (méthodologie ARM) qui est définit par la ressource exposée au risque /le péril /la conséquence. Une cartographie va croiser ressources et périls et de ce fait va identifier les vulnérabilités les plus critiques. Un réseau bayésien va ainsi être décliné pour chaque composante (exposition, survenance, gravité).

La démarche d’analyse qualitative terminée, l’analyse quantitative peut être réalisée ; les mesures de réduction (évitement, prévention, protection) seront modélisées pour obtenir un coût du risque égal au risque résiduel plus la somme du coût de la mesure et du coût d’opportunité.

Cette étape de ‘Transposition du contrat de connaissance’ entre le risk manager et le modélisateur autour d’un scénario est décisive, ce contrat étant vecteur d’informations et de communication sur les risques.

Une fois ce contrat validé, le modèle de risque peut être utilisé par une simulation de Monte Carlo.

Pour ce qui est de l’interdépendance des risques, on peut les agréger par une variable externe. Les assurances peuvent être prises en compte pour faire une simulation des flux de sinistres, vérifier si la couverture est sous-dimensionnée etc. Une simulation d’ensemble donnera une vision globale et une vision par sous-ensemble, le calcul du coût du risque d’ensemble tenant compte des interdépendances et des assurances.

Il convient ensuite de se poser les questions pertinentes ainsi que de réaliser une analyse de sensibilité qui vont s’avérer des outils précieux de feedback et d’évaluation pour valider une méthode, modifier un système etc.

Exemples de questions : les résultats sont-ils stables par rapport à la simulation ? les résultats sont-ils très sensibles à certains indicateurs ? quels sont les indicateurs qui ont le plus d’influence sur le coût du risque ?

Exemples d’analyse de sensibilité : variation du coût du risque par rapport à la simulation, variation du coût du risque en fonction de la distribution des variables parentes, sensibilité aux hypothèses des scénarios.

Parmi les actions correctives envisageables on peut citer : réviser le modèle pour réduire la variance du coût du risque, affiner la connaissance sur les variables les plus sensibles.

En guise de conclusion on peut dire que les réseaux bayésiens réconcilient la mesure et la gestion des risques et que le coût du risque peut se représenter par un modèle causal probabiliste.

Théorie :  Réseaux bayésiens, Patrick Naïm , Pierre-Henri Wuillemin , Philippe Leray ,Olivier Pourret , Anna Becker, Eyrolles 2007 (3e édition)
Applications : Bayesian Networks: A Practical Guide to Applications Olivier Pourret (Editor), Patrick Naïm (Co-Editor), Bruce Marcot (Co-Editor), Wiley, 2008
Quantification des risques : Risk Quantification: Management, Diagnosis and Hedging Laurent Condamin, Jean-Paul Louisot, Patrick Naïm (Elseware, France), Wiley, 2006

Tags: , ,

Aucune réponse à l'article “Petit-déjeuner du 12 octobre 2011 : « Les réseaux bayésiens pour la modélisation des risques »”

Répondre