1 / 27

Partie 2 Principes de tarification de base

Partie 2 Principes de tarification de base. Classification Multivariée. Nous avons vu comment revoir la tarification des variables de tarification une à la fois (Classification Univariée) .

chaeli
Download Presentation

Partie 2 Principes de tarification de base

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Mathématiques et statistique Partie 2 Principes de tarification de base

  2. Mathématiques et statistique Classification Multivariée Nous avons vu comment revoir la tarification des variables de tarification une à la fois (Classification Univariée) . Cependant, ces techniques ont tendance à être biaisées, car elle ne prenne pas compte pleinement de la corrélation qu'il peut exister entre les variables de tarification. Mettre à niveau la prime ou ajuster la prime pure ne corrige que partiellement ce problème, car la tarification courante n'est qu'une approximation des « vrais » relativités affectant la prime pure. Quelques exemples de corrélations existantes : - Certains territoires possèdent des valeurs de maisons plus élevés que d'autres - Les jeunes conducteurs ont tendance à conduire des vieux véhicules - Les jeunes conducteurs ont généralement des cotes de crédit plus basses ...

  3. Mathématiques et statistique Procédure du Biais Minimum Les procédures de Biais Minimum ont été très populaires lors de la 2e moitié du 20e siècle en classification et sont principalement des méthodes univariées standardisées et itératives. Chacune d'entre elles consistent à sélectionner une structure de tarification et une fonction de biais. Structure de Tarification - Additive - Multiplicative - Mixte Fonction de Biais - Balance Principle - Moindres Carrés - Khi Carré - Maximum de Vraisemblance

  4. Mathématiques et statistique Fonction de Biais La fonction de biais sera utilisée afin de comparer les primes pures observées aux primes pures indiquées et de mesurer la différence. Chaque côté de l'équation doit être pondéré par les expositions afin d'ajuster pour la distribution des risques. Balance Principle Sous cette fonction, la somme des primes pures indiquées pondérées doit être égale à la somme des primes pures observées pondérées pour chaque niveau de chacune des variables de tarification. Les changements de tarification pour chacune des variables se feront selon un processus itératif. Somme [Expositions * Prime Pures observées] = Somme [Expositions * Taux de base*Relativités] Car Prime Pure Indiquée = Taux de base * Relativités indiqués

  5. Mathématiques et statistique Fonction de Biais Exemple 1 : Pour un système de tarification à deux variables (sexe et type de territoire), calculer les relativités pour ces deux variables à la l'aide de 2 itérations du « Balance Principle » et à partir des primes pures observés et de la distribution des unités d'exposition ci-dessous :

  6. Mathématiques et statistique Fonction de Biais Exemple 1 : Solution : Soit les relativités suivantes : S1/S2 = Hommes / Femmes T1/T2 = Urbain / Rurale - Assumons un taux de base de 100 $. Les équations ci-dessous doivent balancer : Hommes : 170* 650$ + 90* 300$ = 100$*170*s1*t1 + 100$*90*s1*t2 Femmes : 105* 250$ + 110* 240$ = 100$*105*s2*t1 + 100$*110*s2*t2 Urbain : 170* 650$ + 105* 250$ = 100$*170*s1*t1 + 100$*105*s2*t1 Rurale : 90* 300$ + 110* 240$ = 100$*90*s1*t2 + 100$*110*s2*t2

  7. Mathématiques et statistique Fonction de Biais Exemple 1 : Suite... Cette équation sera résolu de façon itérative, comme point de départ, on va généralement commencer par les relativités obtenues à partir d'une analyse univariée (i.e. Prime pure du niveau / prime pure du niveau de base) sur une variable choisie au hasard, ici le type de territoire: T1= 497 / 267 = 1.86 T2= 1.00 En remplaçant ces valeurs dans les équations de sexe on obtient : Hommes : 137,500$ = 100$*170*s1*1.86 + 100$*90*s1*1.00 137,500$ = 40,620*s1 S1= 3.39

  8. Mathématiques et statistique Fonction de Biais Exemple 1 : Suite... Pour les Femmes : Femmes : 52,650$ = 100$*105*s2*1.86 + 100$*110*s2*1.00 52,650$ = 30,530*s2 S2= 1.72 Une fois les relativités de sexe obtenue, nous avons complété une itération de la procédure. Il faudra en compléter plusieurs jusqu'à ce que les changements des relativités obtenues soient mineurs. En utilisant nos nouvelles relativités de sexe dans les équations des types de territoires, on obtient : Urbain : 136,750$ = 100$*170*3.39*t1 + 100$*105*1.72*t1 136,750$ = 75,690 * t1 T1= 1.81 ce qui est différent de 1.86

  9. Mathématiques et statistique Fonction de Biais Exemple 1 : Suite... Pour les territoires ruraux : Rurale : 53,400$ = 100$*90*3.39*t2 + 100$*110*1.72*t2 53,400$ = 49,430$*t2 T2= 1.08 (différent de 1.00) 2e Itération : Hommes : 137,500$ = 100$*170*s1*1.81 + 100$*90*s1*1.08 137,500$ = 40,490*s1 S1= 3.40 (très prêt de 3.39, on commence déjà à converger)

  10. Mathématiques et statistique Fonction de Biais Exemple 1 : Pour les Femmes (2e itération) : Femmes : 52,650$ = 100$*105*s2*1.81 + 100$*110*s2*1.08 52,650$ = 30,885*s2 S2= 1.70 Pour cette exercice, nous allons arrêter ici, après la 2e itération. Ensuite, il nous reste seulement à re-balancer les relativités selon les niveaux de bases (choisie arbitrairement) : S1 = 3.40 / 1.70 = 2.00 S2 = 1.70 / 1.70 = 1.00 T1 = 1.81 / 1.08 = 1.68 T2 = 1.08 / 1.08 = 1.00 Le niveau prime pure de base doit aussi être ajuster pour les normalisations : 100*1.08*1.72 = 185.76

  11. Mathématiques et statistique Fonction de Biais Balance Principle Au lieu d'utiliser des primes pures, des ratios sinistres-primes pourraient aussi être utilisés principalement à cause qu'ils produisent généralement des résultats plus stables lorsque les risques ne sont pas distribués uniformément. Pour y arriver, il faudra remplacer la prime pure dans les calculs précédents par le ratio-sinistre prime multiplier par la relativité courante de la cellule en question. La raison pourquoi on doit multiplier par la relativité courante est qu'on doit enlever la tarification des variables analysés de la prime pour ensuite les ré-évaluer. Par exemple, pour un risque en particulier : RSP = Sinistres / Prime = Sinistres / (Niveau de base * Relativités Courantes)

  12. Mathématiques et statistique Structure de Tarification Les calculs nécessaire afin d'ajouter plusieurs autres variables (ou plusieurs autres niveaux) de tarification rendent le processus beaucoup plus complexe et nécessite l'utilisation d'un ordinateur. Pour cette raison, les questions d'examens ne devraient pas contenir plus de deux variables. En utilisant le « Balance Principle », les relativités doivent multiplier le taux de base seulement si la structure de l'algorithme est multiplicative (ce qui est généralement le cas). Si la structure est additive, nous allons plutôt travailler avec des rabais/surcharges et non des relativités. Le côté droit de la formule devient donc : Somme [Expositons * Taux de base*( 1 + Somme des Rabais/Surcharges)] Pour un algorithme mixte : Somme [Expositions*Taux de base*(Relativités+Somme des Rabais/Surcharges)]

  13. Mathématiques et statistique Modélisation GLM Un GLM est un modèle linéaire généralisé et est la technique de classification standard utilisé dans plusieurs marchés à travers le monde (principalement en lignes personnelles). À cause de sa complexité, elle est moins transparente que les techniques univariées plus simples, mais l'est quand même beaucoup plus que d'autres méthodes avancées tel que les réseaux de neurones. Contrairement à une régression linéaire standard, les GLMS ont des hypothèses plus souples : - Un GLM n'assume pas l'hypothèse de normalité - La variance n'est pas nécessairement constante - Une fonction (appelé la « link function ») définie la relation entre les variables réponses (fréquence, sévérité, prime pure) et la combinaison linéaire des variables de tarification (age, sexe, territoire...)

  14. Mathématiques et statistique Modélisation GLM Le choix de la « link function » va dépendre de la structure de l'algorithme : - Additive = Fonction Identité (1.00) - Multiplicative = Fonction logarithmique Les distributions utilisées pour remplacer l'hypothèse de normalité font généralement partie de la famille des lois exponentielles. Par exemple, les standards de l'industrie pour l'assurance automobile sont: - Réclamations = Loi Poisson - Sévérité = Loi Gamma - Prime Pure = Loi mixte Poisson/Gamma (appelé Loi Tweedie) Une fois les paramètres du GLM sélectionnés, la méthode du maximum de vraisemblance est ensuite utilisée afin de minimiser l'erreur produite entre l'expérience observé et les résultats sortant du modèle.

  15. Mathématiques et statistique Modélisation GLM On se rappelle qu'un modèle linéaire tente d'exprimer une variable observée Y par une combinaison de plusieurs variables Xi(ici X1 à X...) plus une variable d'erreur Ɛ suivant une N(0,σ2) . Y = β1X1 + β2X2 + β3X3+ …. + Ɛ Sous forme matricielle et pour plusieurs variables observées, cette formule devient : Y = E(Y) + Ɛ avec E(Y)= X * β Y = [ Y1 Y2 Y3 ... ]-1 β = [ β1 β2 β3 ... ]-1 Chaque variable de tarification Xi sera représenté par un vecteur Xi = [ X1i X2i X3i ... ]-1qui définit la présence d'un niveau d'une variable de tarification (Xi = 1 si la variable observé Yi est à ce niveau, sinon 0 pour le niveau de base)

  16. Mathématiques et statistique Modélisation GLM Pour un modèle GLM, ces formules deviennent : - La variable d'erreur Ɛ suit une loi provenant de la famille des lois exponentielle (i.e. Poisson, Gamma,...) - La relation entre les variables observées et la combinaison linéaire des variables de tarification suit une fonction g (link function) : E(Y)= g-1(X*β) Par exemple si g est une fonction logarithmique, la structure de l'algorithme devient multiplicative : Y1 = Exp(β1X11 + β2X21 + …) = Exp(β1X11) * Exp(β2X21) * Exp(β3X31) ... Où les Exp(βi) sont les relativités estimés.

  17. Mathématiques et statistique Modélisation GLM Si au contraire g est égale à la fonction identité, la structure de l'algorithme devient additive : E(Y)= g-1(X*β) = X*β E(Y1) = β1X11 + β2X21 + … = β1X11+β2X21+β3X31 ... Où les βi sont les rabais/surcharges estimés.

  18. Mathématiques et statistique Modélisation GLM Exemple de résultat sortant d'un logiciel modélisant des GLMs:

  19. Mathématiques et statistique Modélisation GLM Exemple 2 : À partir des primes pures moyennes ci-dessous, estimer les relativités à charger à partir d'un GLM où l'erreur suit une Poisson et la structure de l'algorithme est multiplicative.

  20. Mathématiques et statistique Modélisation GLM Exemple 2 : Suite... Définissons tout d'abord les différents vecteurs, dans cet exemple, il y a quatre variables observées : Hommes-Urbains, Hommes-Ruraux, Femmes-Urbains et Femmes-Ruraux Et trois variables prédictives : B1 = Hommes , B2 = Femmes , B3 = Urbain/Rurale Note : Les Hommes/Femmes ne peuvent pas être regroupés ensembles car il faut au moins une variable présente pour le niveau de base

  21. Mathématiques et statistique Modélisation GLM Exemple 2 : Suite... Pour un algorithme multiplicatif, on choisit la fonction logarithmique comme « link function ». L'inverse de cette fonction est la fonction exponentielle. Pour notre vecteur contenant nos variables prédictives, on obtient :

  22. Mathématiques et statistique Modélisation GLM Exemple 2 : Suite... On doit maintenant résoudre l'équation matricielle à l'aide de la technique du maximum de vraisemblance : La fonction de la loi Poisson est : On doit donc évaluer cette fonction pour tous les yi et ensuite prendre le logarithme afin de se faciliter des calculs:

  23. Mathématiques et statistique Modélisation GLM Exemple 2 : Suite... Comme ui = g-1(Xi * β) ce qui représente l'estimé de la moyenne pour la variable observée y, on obtient : Finalement, si on remplace les variables par les données de cette exemple :

  24. Mathématiques et statistique Modélisation GLM Exemple 2 : Suite... Afin de trouver le maximum de vraisemblance, on dérive l'équation en fonction des trois bétas, pour obtenir :

  25. Mathématiques et statistique Modélisation GLM Exemple 2 : Suite... Comme on recherche les relativités =Exp(βi), on doit résoudre les équations suivante : R1*(R3+1) = 1300 R2*(R3+1) = 600 R3*(R1+R2) = 1200 Pour finalement obtenir : R1 = 478.95, R2 = 221.05, R3 = 1.714 Si les hommes sont le niveau de bases, les relativités sont rebalancés à : R1 = 478.95/ 478.95 = 1.00 et R2 = 221.05/ 478.95 = 0.462

  26. Mathématiques et statistique Modélisation GLM Comme vous avez plus le remarquer, les concepts derrières les GLMs sont relativement complexes. Pour cette raison, une compréhension complète ne sera pas attendue pour l'examen. Les sujets pouvant être testés seront : - Compréhension de la théorie derrière un GLM (i.e. hypothèses de base) - Définir les différents vecteurs/matrice pour résolution d'un GLM (sans résolution) et expliquer brièvement les étapes nécessaires à la résolution

  27. Mathématiques et statistique Exercices Voici quelques exercices des examens antérieurs de la CAS pertinents à la matière de cette section : Exam 8 – Fall 2010 : #3, #4 Exam 8 – Fall 2010 : #3, #4 Exam 9 – Fall 2010 : #3, #4 Exam 9 - Fall 2009 : #3, #5 Exam 9 – Fall 2008 : #6, Note Les exercices sont disponibles sur la site de la CAS à l'adresse suivante : http://www.casact.org/admissions/studytools/exam9/ et http://www.casact.org/admissions/studytools/exam8/

More Related