Gestion des événements à risque associés à une distribution à queue lourde
Le risque et les queues de distribution
Le risque est un concept philosophique pour lequel il existe plusieurs définitions. Toutefois, de manière générale, le risque est associé à un événement imprévu ayant un impact négatif. Il ne s’agit pas d’un élément normal auquel vous vous attendez : le risque ne fait pas partie des scénarios de référence et il est imprévu.
Pensez à un événement qui peut présenter un risque pour votre entreprise. Si vous procédez à une distribution de probabilités pour toutes les conséquences potentielles de cet événement, votre scénario de référence et vos attentes se situeront probablement autour de la moyenne. Pensez à la célèbre courbe en forme de cloche. Si vous vous déplacez d’un côté ou de l’autre de la courbe, vous entrez dans la zone des résultats inattendus, appelée queue de distribution.
L’étude des queues de distribution est donc essentielle à la gestion des risques. Que ce soit dans le cadre d’évaluations des risques fondées sur les probabilités ou d’études qualitatives des dangers, la gestion des risques aide à comprendre les événements à risque. Les mesures du risque, comme la valeur à risque ou le manque à gagner prévu, sont essentiellement des mesures de queues de distribution. Par exemple, si vous vous inquiétez des risques de dépassement des coûts d’un projet, vous vous inquiétez de la queue de distribution des coûts.
Nous pourrions donc définir tous les risques comme des événements qui se situent dans une queue de distribution. L’étude des queues de distribution est d’une importance capitale en gestion quantitative des risques. Par exemple, plus vous êtes en présence d’une distribution à queue lourde, plus les probabilités que des risques inattendus surviennent sont élevées. Il est donc impératif d’adopter la bonne approche et les bonnes méthodes pour étudier les queues lourdes, notamment en lien avec les événements rares, catastrophiques et de type cygne noir.
Qu’est-ce qu’une distribution normale?
De nombreux phénomènes naturels et résultats systémiques suivent ce qu’on appelle une distribution normale. En fait, une distribution est dite « normale » lorsque les résultats sont répartis de manière symétrique autour d’une moyenne. La notion de distribution normale est une belle et puissante découverte en mathématiques. Elle constitue le fondement de la statistique et nous permet d’étudier de nombreux phénomènes à partir de seulement deux données : la moyenne et la variance. Fait important, en ce qui concerne les risques, la distribution normale comporte des queues très étroites.
Plus important encore, plus nous recueillons des données sur des phénomènes associés à une distribution normale, plus nos estimations de la moyenne et de la variance s’améliorent. Autrement dit, la moyenne et la variance convergent vers des valeurs finies. Prenons par exemple la taille des pommes d’un arbre donné : plus vous cueillez de pommes, plus vous êtes en mesure d’évaluer leur taille moyenne et la variance, qui convergent. Mais faites attention, car ce n’est pas toujours le cas!
La distribution normale s’applique uniquement aux systèmes dont les processus sont suffisamment indépendants et qui mènent à des résultats identiques et indépendants. À mesure que les processus internes d’un système deviennent plus complexes et interdépendants, les résultats commencent à s’éloigner de la distribution normale. La méthode Monte-Carlo constitue un excellent exemple. Les analystes des coûts savent qu’une fois qu’ils intègrent les corrélations entre les facteurs de coût, les résultats de la courbe des coûts totaux s’éloignent considérablement de la distribution normale.
Par conséquent, plus les processus internes des systèmes deviennent interdépendants et interreliés, plus les résultats obtenus s’éloignent de la distribution normale de diverses façons, notamment en présentant des queues plus lourdes (le cas inverse est aussi vrai). L’utilisation d’un modèle de distribution normale pour quantifier les queues devient donc de moins en moins appropriée.
À quel point les queues deviennent-elles lourdes? Quel est le degré de complexité pouvant être atteint?
La complexité des processus internes et les interdépendances entre ces derniers (c.-à-d. le processus de génération de données) peuvent entraîner des queues plus lourdes. La probabilité de distribution à queue lourde étant plus élevée, l’utilisation de méthodes fondées sur une distribution normale augmentera dans un tel cas le risque d’erreur.
À mesure que les interdépendances entre les systèmes augmentent et que les processus internes deviennent plus multiplicatifs, la notion de variance finie, et même celle de moyenne finie, peut être faussée. Cela signifie que plus nous recueillons des données, plus la variance arithmétique (et même la moyenne) risque d’augmenter de façon constante et moins les résultats risquent de converger. Pour ces phénomènes extrêmement interdépendants, toute application de la moyenne arithmétique est essentiellement dénuée de sens. La distribution à queue lourde devient radicalement différente de la distribution normale. Les distributions à queue lourde ou épaisse sont rares, mais elles surviennent dans la nature, dans le cadre de projets et à l’intérieur de systèmes techniques.
Il existe de nombreux processus associés à une distribution à queue épaisse autour de nous. Prenons l’exemple des tremblements de terre. Chaque année, de nombreuses petites secousses sismiques surviennent. L’intensité moyenne des secousses sismiques à un endroit donné n’est pas utile, car le risque est associé à l’événement dont l’intensité est élevée. En outre, la moyenne n’est peut-être pas significative du tout en raison d’une distribution très lourde. Selon nos analyses des dépassements de coûts des projets, de tels événements sont effectivement associés à une distribution à queue lourde, parfois même à une variance infinie. Toutefois, comme nous avons pu le constater, la moyenne connexe est finie. Parmi les autres phénomènes associés à une distribution à queue lourde, mentionnons les pandémies, les éruptions solaires, les pannes d’électricité, les attaques terroristes, les feux de forêt, la population des villes, la valeur nette des personnes, les citations de documents, etc.
Tous ces phénomènes ont en commun la nature multiplicative des processus internes de génération de données.
Gérer les risques associés à une distribution à queue lourde
Les méthodes statistiques et mathématiques utilisées pour gérer les risques associés à une distribution à queue lourde sont bien établies; elles demeurent toutefois légèrement non conventionnelles par rapport aux méthodes générales d’évaluation des risques industriels. Pour commencer, nous devrions nous intéresser aux interdépendances dans le processus de génération de données et essayer de les prendre en considération de manière explicite.
Bien que les méthodes conventionnelles de quantification des risques comme la logique booléenne et la dissection des scénarios de risque soient extrêmement puissantes à certains égards, il arrive souvent qu’elles ne permettent pas la modélisation des dépendances probabilistes et conditionnelles, élément d’importance capitale lorsqu’il s’agit de phénomènes associés à une distribution à queue lourde. De plus, malgré la puissance et l’utilité des distributions normales, nous devrions nous efforcer d’utiliser des distributions exactes avec des queues représentatives. Nous devrions même éviter les méthodes statistiques et les techniques d’apprentissage automatique fondées sur une logique de distribution normale.
Bon nombre de phénomènes associés à une distribution à queue lourde sont à l’avant-plan de la gestion des risques dans divers secteurs industriels. Une gestion adéquate permet d’économiser de précieuses ressources publiques et privées en améliorant la planification et la prise de décisions, ainsi qu’en permettant de créer des projets plus sûrs, de réaliser des activités plus durables et de mieux se préparer à affronter un monde de plus en plus incertain. Le groupe de la gestion des risques de Hatch s’efforce d’élargir son portefeuille d’outils et de mieux comprendre les risques et les phénomènes associés à une distribution à queue lourde.
Remarque : Les expressions « queue épaisse » et « queue lourde » sont utilisées de manière interchangeable dans le présent article, mais aux plans scientifique et technique, elles comportent de légères différences.
Pouya Zangeneh
Spécialiste de l’analyse des risques, Gestion des risques
Pouya est spécialiste de l’analyse des risques et fait partie de l’équipe Gestion des risques de Hatch. Ingénieur professionnel, il a récemment terminé un doctorat spécialisé dans la représentation des connaissances et les méthodes probabilistes. Ses travaux visaient à quantifier, à mesurer et à mettre à jour les risques sociaux et techniques et les pertes correspondantes en lien avec des projets et à des systèmes techniques. Il possède une vaste expérience à titre d’ingénieur spécialisé en sismologie et en dynamique structurale dans le cadre de projets dans les secteurs des mines et métaux, des infrastructures et de l’énergie.