Un modèle machine learning prédictif en assurance non-vie
Contexte concurrentiel et réglementaire
Dans un contexte d’accroissement de la concurrence et d’une pression réglementaire accrue, la justesse et la précision actuarielle, ainsi que la transparence et la compréhension du tarif, sont des enjeux clés pour le secteur de l’assurance non-vie. D’une part, les modèles linéaires généralisés (GLM) traditionnellement utilisés favorisent l’interprétabilité et la facilité d’utilisation. D’autre part, les modèles de machine learning et deep learning capturent la complexité des relations non-linéaires entre les variables, améliorant la performance prédictive. Cependant, ces modèles prédictifs black box peinent à assurer la transparence dans leurs processus de prise décision. Ainsi, les assureurs sont souvent confrontés à un arbitrage entre la performance et l’interprétabilité lors de la sélection des méthodes prédictives.
L’essor de l’intelligence artificielle
Ces dernières années ont été marquées par un développement des techniques d’intelligence artificielle explicable dans le cadre des efforts déployés pour améliorer la transparence, l’explicabilité et l’interprétabilité des modèles. Appliquées au contexte assurantiel, ces méthodes participent à élucider les relations entre la variable à prédire et les variables explicatives, à la fois localement et globalement. Elles permettent également le classement des variables par ordre d’importance tout comme l’évaluation des interactions entre les variables.
Le modèle Explanable Boosting Machine
A la lumière de ces travaux récents axés sur l’interprétabilité des modèles de machine learning, nous introduisons le modèle Explainable Boosting Machine (EBM) pour la tarification en assurance non-vie. Le modèle EBM s’appuie sur le modèle additif généralisé (GAM) et utilise des arbres de décision, agrégés avec les méthodes de bagging et de boosting, comme des fonctions composantes. Plus précisément, ce modèle utilise la méthode du cyclic gradient boosting, une technique basée sur l’optimisation classique par la descente de gradient cyclique, assurant l’interprétabilité par un apprentissage indépendant des fonctions composantes. Cette approche offre l’avantage d’une interprétabilité directe, ne nécessitant pas de recourir aux techniques d’interprétabilité post-hoc et s’adaptant mieux aux exigences de prise de décision.
Développement des modèles de machine learning
Le modèle EBM, présenté dans cet article, est classifié comme un modèle glass box, i.e. un modèle qui combine des caractéristiques intrinsèquement interprétables avec une haute performance prédictive. L’utilisation des fonctions composantes permet la visualisation de la contribution locale de chaque variable à la prédiction finale et facilite le calcul des scores d’importance, qui constituent un atout précieux dans l’interprétabilité du modèle et le processus de sélection des variables.
De plus, l’utilisation de l’algorithme de sélection GA2M permet la prise en compte des termes d’interaction, qui demeurent interprétables par la visualisation des heatmaps. Notre contribution s’inscrit donc dans un courant de littérature récent, axé sur le développement des modèles de machine learning à la fois performants et intrinsèquement interprétables.
Cet article examine l’interprétabilité du modèle EBM dans le cadre d’une application à la modélisation de la fréquence et de la sévérité des sinistres en assurance automobile. Pour évaluer la robustesse des résultats du modèle EBM, nous comparons ses performances en matière de prédiction, ainsi que les explications qu’il fournit avec les résultats d’autres modèles benchmark de machine learning.
Pour aller plus loin :

AI Insights | IA Générative et assurance : Quels modèles pour quels usages ?
Découvrez des technologies innovantes telles que les grands modèles de langage, les réseaux antagonistes génératifs (GANs) et les modèles de diffusion, leviers majeurs de l’IA générative.


Assurance Auto, MRH, Santé/Prévoyance : quels enjeux tarifaires pour 2025 ?
Les équipes de l’Observatoire addactis® ont décrypté les tendances et les évolutions tarifaires attendues 2025 en assurance Auto, MRH et Santé/Prévoyance.



Data Insights | Python pour l’actuariat : Puissance et efficacité
Ecosystème Python, Approches de programmation en Python, Python : L’allié de choix pour l’IA..