1 / 47

Анализ выживаемости SAS/STAT

Анализ выживаемости SAS/STAT. АНАЛИЗ ВЫЖИВАЕМОСТИ. Что такое Анализ Выживаемости и для решения каких задач его стоит применять Математические основы метода Какие инструменты Анализа Выживаемости вы можете найти в SAS/STAT Примеры, примеры, примеры. Исторический обзор.

kimi
Download Presentation

Анализ выживаемости SAS/STAT

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Анализ выживаемости SAS/STAT

  2. АНАЛИЗ ВЫЖИВАЕМОСТИ Что такое Анализ Выживаемости и для решения каких задач его стоит применять Математические основы метода Какие инструменты Анализа Выживаемости вы можете найти в SAS/STAT Примеры, примеры, примеры...

  3. Исторический обзор Анализ выживаемости – набор статистических методов для предсказания как факта наступления события, так и времени до него • Появилсяоколо века назад (lifetime tables) • Новый импульс - Cox (proportional hazards model)в журнале JRSSB-1972: на сегодняшний день - самая цитируемая статья по статистике в истории • Главным образом применялся в клинических исследованиях и производственном контроле • С большой скоростью набирает популярность в телекоме и кредитном скоринге

  4. сферы применения CRM Предсказание оттока Оценка эффективности маркетинговых кампаний Анализ выживаемости Кредитный скоринг Планирование маркетинговых кампаний Predictive Maintenance Определение ключевых факторов риска T Медицина

  5. Анализ выживаемости vsтрадиционный data mining Анализ выживаемости В чем отличие от традиционных методов Data Mining? Наблюдения с неизвестным исходом не отбрасываются Помимо самих факторов, включаем в модель и их прогнозы(курсы валют, динамика поведения) Модели точнее и функциональнее Используется информация обо всех объектах

  6. APPLIcATIONS & RESEARCH НЕЗАВИСИМЫЕ ЭКСПЕРТЫ SAS Крупный частный латиноамериканский банкСистема управления рискамиПолучение информации о динамике покупательной способности клиентов во времени NHS Blood and TransplantБолее эффективное использование скудной и ценной информации о выживаемости клиентов после пересадки органовАккуратный подбор донора и реципиента продлевает срок жизни клиентов и существенно улучшает её качество Jonathan CrookProfessor of Business Economics & Director, MSc Banking & Risk,Edinburgh Christophe MuesSenior Lecturer of Southampton Management School,Southampton .....и многие, многие другие активно исследуют применении Анализа Выживаемости в кредитном скоринге и CRM

  7. ОСНОВНЫЕ определения Событие: некий триггер, сработавший на «клиенте» Цензурирование: выбывание из наблюдаемой выборки под действием сторонних факторов  переезд в другой город, окончание эксперимента до наступления события, смерть Ковариаты: характеристики «клиента», влияющие на его «отток» возраст, пол, город, а также динамика дохода, динамика курсов валют, ... ФУНКЦИЯ ВЫЖИВАЕМОСТИ ФУНКЦИЯ РИСКА

  8. ФУНКЦИЯ ВЫЖИВАЕМОСТИ

  9. цензурирование Конец наблюдений А что случится с ними? Этого никто не знает Начало наблюдений

  10. Exploratory data analysis using survival curves

  11. Kaplan-Meier Model Количество выбывших в интервал времени T (number at death) Количество под угрозой выбывания(number at risk)

  12. Kaplan-Meier Model : COMPARING SURVIVAL CURVES Confidence Limits • Different Statistical Tests • Log Rank • Wilcoxon • Likelihood-Ratio

  13. Kaplan-Meier Model : DIFFERENT STATISTICAL TESTS Log Rank Wilcoxon Likelihood-Ratio(parametric) Distribution of Event times Exponential

  14. PROC LIFETEST

  15. PROC LIFETEST: COMPARING SURVIVAL CURVES

  16. PROC LIFETEST: COMPARING SURVIVAL CURVES Are HazardFunctionsproportional? DoesLikelihood-Ratio test applicable? YES NO

  17. PROC LIFETEST: COMPARING MULTIPLE SURVIVAL CURVES proclifetestdata=sasuser.methadone plots=(survival(cb=hw)) notable; time time*status(0); strata dose(5070) / test=logrank adjust=scheffenodetail; run;

  18. PROC LIFETEST: COMPARING MULTIPLE SURVIVAL CURVES proclifetestdata=sasuser.methadone plots=(survival(cb=hw)) notable; time time*status(0); strata dose(5070) / test=logrank adjust=scheffenodetail; run; Dose < 50 and Dose =60 differ?  NO Dose > 70 and Dose =60 differ?  YES Dose > 70 and Dose <50 differ?  YES

  19. Alternative to Kaplan-meier: life table methods LIFE TABLEthe same as Kaplan-Meier Estimate, but … CENSORED OBS ARE CENSORED IN THE MIDDLE OF INTERVAL GROUP OBSERVATIONS INTO BINS LARGE SAMPLES

  20. Alternative to Kaplan-meier: life table methods proclifetestdata=sasuser.methadone plots=(survival(failure) hazard) method=life intervals=183365548; time time*status(0); strata clinic / test=(all) nodetail; run;

  21. Cox’s PROPORTIOnal hazards model

  22. SURVIVAL MODELS • Models in Survival Analysis are written in terms of Hazard Functions • They assess the relationship of covariates to survival times • Models can be parametric or semi-parametric PARAMETRIC PROC LIFEREG SEMI-PARAMETRIC PROC PHREG Distribution of Event Times is specified Hazard function is completely specified (except for params) Distribution of Event Times is unknown Hazard function is unspecified Cox Proportional Hazards Model OK for ! Exp Hazards Weibull HazardsUsually a poor choice!

  23. Cox proportional hazards model The model provides the primary information desired from a survival analysis Minimum of assumptions Robust regression estimates of the influence of covariates Thus, the model is extremely popular

  24. Proportional hazards assumption

  25. Deriving coefficients: partial likelihood maximization ILLUSTRATION

  26. Deriving coefficients: partial likelihood maximization

  27. TIED OBSERVATIONS Tied observations They must be taken into account in Partial Likelihoodcalculation! SAS/STAT PROC PHREGdoes it automatically! (Breslow approximation)

  28. PROC PHREG

  29. PROC PHREG: FIT COX REGrEssion model to methadone data COEFFICIENTESTIMATE COEFFICIENT not equal to 0?

  30. PROC PHREG: ADJUST SURVIVAL CURVES

  31. Cox PH Model assessment COX MODEL ASSUMPTIONS Proportional HazardsThe effect of the predictor is the same over all values of time LinearityLog Hazard linearly depends on predictors AdditivityThe joint effect of predictors equals the sum of their separate effects TIME-VARIABLE DEPENDENCE CUMULATIVE RESIDUALS PLOT

  32. Assess PH using time-VARIABLE DEPENDENCE

  33. Assess PH using cumulative residuals plot RESIDUAL Simulated Observed SIMULATE IT!

  34. MODEls with NON-PROPORTIOnal hazards

  35. MODELIng non-proportional hazards WAYS to HANDLE NON-PROPORTIONAL HAZARDS Stratified Cox PHVary Baseline hazard Cox PH with time-dependent varsModel non-proportionality using interactions with functions of time Piecewise Cox PHThe effect of variable is assessed separately for different times

  36. Stratified cox model

  37. STRATIFIED COX MODEL 1. Dose*Clinic & Clinic*Prison DROP Dose*Clinic 2. Clinic*Prison DROP Clinic*Prison

  38. STRATIFIED COX MODEL 3. No interactions STAY at this model complexity 4. Try to adjust Baseline Hazard by Clinic

  39. Models with interactions with time 2 WAYS of INTRODUCING TIME INTO PARAMETER ESTIMATES Change the effect βof the variable Change the variableitself

  40. Models with interactions with time KEEP

  41. PIECEWISE COX MODEL CREATE INTERACTION with HEAVISIDE FUNCTION!

  42. PIECEWISE COX MODEL

  43. ADVANCED TOPICS

  44. TIME-dependenT COVARIATES New time-dependent covariates must be specified inside PROC PHREG procphregdata=sasuser.methadone; class Clinic (param=ref ref='2'); model Time*Status(0)=Clinic Dose Prison Drink / ties=exact rl=pl; Drink=(0 <= DrinkStart < Time); run;

  45. Modeling the effect of time-dependent predictors «Drink» is time dependent and it’s important! Coefficients are the same for the whole survey period

  46. REPEATED EVENTS Some events are intrinsically repeatable: pregnancy, infection One should account for this in survival analysis

  47. REPEATED EVENTS: different models for succ events Model men’s muscle soreness in 4 intervals depending on age and treatment 1. 2. 3. Drop 4. Drop Build different survival models for successive events

More Related