Mémoire présenté devant l’ENSAE ParisTech pour l’obtention du diplôme de la fili
Mémoire présenté devant l’ENSAE ParisTech pour l’obtention du diplôme de la filière Actuariat et l’admission à l’Institut des Actuaires le 16/11/2016 Par : Jonathan Karsenty Titre : La détection de fraudes à l’assurance Confidentialité : □ ✓NON □OUI (Durée : □1 an □2 ans) Les signataires s’engagent à respecter la confidentialité indiquée ci-dessus Membres présents du jury de la filière Entreprise : PwC Nom : Emmanuel Dubreuil Signature : Membres présents du jury de l’Institut Directeur du mémoire en entreprise : des Actuaires Nom : Emmanuel Dubreuil Signature : Autorisation de publication et de mise en ligne sur un site de diffusion de documents actuariels (après expiration de l’éventuel délai de confidentialité) Signature du responsable entreprise Secrétariat : Signature du candidat Bibliothèque : Ecole Nationale de la Statistique et de l’Administration Economique (ENSAE) 3, Avenue Pierre Larousse - 92245, MALAKOFF CEDEX, FRANCE Remerciements Je tiens tout d’abord à remercier ma tutrice de stage, Dorothée Jolly, pour m’avoir enca- dré, motivé et pour m’avoir donné sa confiance lors de la réalisation de ce mémoire. Je remercie également François Beugin, Emmanuel Dubreuil ainsi que Vincent Gibrais, associés du cabinet PwC pour m’avoir accueilli au sein du service RVMS – Actuariat et Finance Quantitative. Je tiens aussi à remercier François Gélan, Mickaël Baret, Pierre Martel, Emmanuel Perrin et Gabrielle Terré pour la qualité de leurs conseils et leur gentillesse. Je souhaite aussi remercier Sandrine Créhange et Marie-Hélène Sylvestre pour leur accueil chaleureux, leur bonne humeur et leur écoute tout au long de mon stage. J’adresse aussi mes remerciements à toute l’équipe encadrante de l’ENSAE ParisTech et tout particulièrement mon tuteur pédagogique, Nicolas Baradel, pour sa disponibilité, son écoute ainsi que ses conseils avisés. Je remercie tout particulièrement Arthur Charpentier pour tout ce qu’il m’a appris, pour m’avoir inspiré, pour continuer de m’inspirer et pour avoir renforcé ma curiosité dans les do- maines de l’actuariat, de la data science et des mathématiques. Enfin, je souhaite remercier mes collègues, amis, famille et surtout mes parents pour m’avoir permis d’arriver jusqu’ici et sans qui je n’aurais pas pu réaliser ce mémoire. Je souhaite dédier ce mémoire à ma sœur, Inès Karsenty. Résumé La fraude est une problématique bien connue des assureurs à laquelle toutes les branches de l’assurance sont exposées. Détecter efficacement les fraudes permettrait une diminution des primes, des provisions techniques et in fine du capital réglementaire sous Solvabilité II. Outre ces aspects actuariels, la détection de fraude permettrait aussi, à travers la diminution des primes, une compétitivité accrue sur le marché de l’assurance. De nos jours, les assureurs indemnisent encore beaucoup trop de sinistres frauduleux. Les chiffres de l’ALFA (Agence pour la Lutte contre la Fraude à l’Assurance) le démontrent, ils estiment l’indemnisation de sinistres frauduleux (en France) à 2,8 milliards d’euros sur l’exercice 2013 alors que seulement 8 % (en montant) des fraudes à l’assurance sont détectées. Ce chiffre s’ex- plique par le fait que, pour la plupart des assureurs, les sinistres ne sont expertisés que sous la forte suspicion de leurs gestionnaires de sinistres. Nous proposons dans ce mémoire une première démarche : développer une méthodologie permettant de détecter les fraudes en amont du versement de l’indemnisation lors de la décla- ration du sinistre. Il existe un réel problème en matière de données dans le cadre de la fraude à l’assurance. En effet, la fraude n’est avérée que si une expertise du sinistre est effectuée. Les données enre- gistrées dans les bases des assureurs ne sont donc pas totalement fiables car conditionnées à la suspicion des gestionnaires de sinistre. Afin de pallier ce problème, nous développons donc les méthodes d’apprentissage non-supervisées (ne nécessitant pas de connaître, a posteriori, la variable à modéliser, ici : la variable binaire « fraude ») de RIDIT et de PRIDIT. Nous utilisons la méthode de RIDIT afin de calculer un score de suspicion de fraude pour chaque variable. Cette méthode n’opérant à l’origine que sur des variables catégorielles, nous prolongeons cette méthode (sans perte de précision) aux variables continues. Après l’application du score de RIDIT sur chacune de nos variables, nous obtenons une matrice de scores avec les individus en lignes et les variables en colonnes. Nous utilisons alors la méthode de PRIDIT afin de calculer un score global de fraude par individu. Nous aboutissons enfin à une classification des sinistres en tant que fraude ou non-fraude, à une évaluation sur un échantillon de données test afin de valider notre démarche ainsi qu’à une critique de la méthodologie. Mots clefs : Fraude à l’assurance, informations biaisées, méthode non-supervisée, RIDIT, score par variable, PRIDIT, score global, classification. 1 Abstract Insurance fraud is a growing issue for all insurance companies, affecting every line of busi- ness. As fraud cuts profits for insurers, being able to detect them would allow lower premiums, decrease best estimate liabilities and the solvency capital requirement under Solvency II. Be- sides these actuarial aspects, fraud detection would also, through lower premiums, increase competitiveness in the insurance market. Nowadays, insurers still pay too many fraudulent claims. Indeed, ALFA (the French insurance fraud bureau) estimates fraudulent claim pay- ments (in France) to be 2.8 billion euros in 2013 ; however only 8% of this amount was detected as fraudulent claims. These numbers can be explained by the fact that most insurers would only audit claims under the strong suspicion of their claim handlers. Therefore, in this thesis a methodology will be presented to detect fraud as soon as the claim is notified and before any payment is made. Accurate detection of insurance fraud is hampered by a lack of quality data. Insurance fraud is not proven until an audit of the claim is made. Data stored into insurers’ databases are not completely reliable because they are conditional upon claim handlers’ suspicion. To overcome this issue, we will develop non-supervised learning methods : RIDIT and PRIDIT methods. The main advantage of these methods is that they do not require knowing, a posteriori, the variable to model (in this case, the binary variable «fraud»). We first start by using the RIDIT method to calculate a fraud suspicion score for each variable. As RIDIT only applies to categorical variables, we extended it to continuous variables (without loss of accuracy). After applying RIDIT scoring for each variable, we obtain a fraud suspicion score matrix. We use the PRIDIT method to obtain an overall fraud suspicion score for each claim. According to the score, we are able to classify claims as fraudulent or non- fraudulent, evaluate those methods on a test sample in order to validate our approach and perform a review of the methodology. Keywords : Insurance fraud, unreliable data, unsupervised method, RIDIT, fraud suspicion score, PRIDIT, overall fraud suspicion score, classification. 2 Table des matières Résumé 1 Abstract 2 Introduction 6 1 Cadre de l’étude sur la fraude 7 1.1 La fraude à l’assurance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.1.1 Les types de fraudes à l’assurance . . . . . . . . . . . . . . . . . . . . . . 7 1.1.2 Les sanctions de la fraude . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.2 La place de la fraude dans l’assurance . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2.1 La fraude dans le processus de souscription . . . . . . . . . . . . . . . . . 11 1.2.2 La fraude dans le processus de gestion des sinistres . . . . . . . . . . . . 12 1.3 Conséquences de la fraude sur les compagnies d’assurance . . . . . . . . . . . . . 14 1.3.1 Les effets de la fraude sur les assureurs . . . . . . . . . . . . . . . . . . . 14 1.3.2 Les actions des assureurs envers la fraude . . . . . . . . . . . . . . . . . . 23 1.4 Objectifs de l’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.4.1 Recherches bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.4.2 Données disponibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.4.3 Objectifs et méthodologies . . . . uploads/Geographie/ fraude.pdf
Documents similaires










-
27
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Nov 16, 2022
- Catégorie Geography / Geogra...
- Langue French
- Taille du fichier 1.5619MB