530 likes | 963 Views
Анализ выживаемости SAS/STAT. АНАЛИЗ ВЫЖИВАЕМОСТИ. Что такое Анализ Выживаемости и для решения каких задач его стоит применять Математические основы метода Какие инструменты Анализа Выживаемости вы можете найти в SAS/STAT Примеры, примеры, примеры. Исторический обзор.
E N D
АНАЛИЗ ВЫЖИВАЕМОСТИ Что такое Анализ Выживаемости и для решения каких задач его стоит применять Математические основы метода Какие инструменты Анализа Выживаемости вы можете найти в SAS/STAT Примеры, примеры, примеры...
Исторический обзор Анализ выживаемости – набор статистических методов для предсказания как факта наступления события, так и времени до него • Появилсяоколо века назад (lifetime tables) • Новый импульс - Cox (proportional hazards model)в журнале JRSSB-1972: на сегодняшний день - самая цитируемая статья по статистике в истории • Главным образом применялся в клинических исследованиях и производственном контроле • С большой скоростью набирает популярность в телекоме и кредитном скоринге
сферы применения CRM Предсказание оттока Оценка эффективности маркетинговых кампаний Анализ выживаемости Кредитный скоринг Планирование маркетинговых кампаний Predictive Maintenance Определение ключевых факторов риска T Медицина
Анализ выживаемости vsтрадиционный data mining Анализ выживаемости В чем отличие от традиционных методов Data Mining? Наблюдения с неизвестным исходом не отбрасываются Помимо самих факторов, включаем в модель и их прогнозы(курсы валют, динамика поведения) Модели точнее и функциональнее Используется информация обо всех объектах
APPLIcATIONS & RESEARCH НЕЗАВИСИМЫЕ ЭКСПЕРТЫ SAS Крупный частный латиноамериканский банкСистема управления рискамиПолучение информации о динамике покупательной способности клиентов во времени NHS Blood and TransplantБолее эффективное использование скудной и ценной информации о выживаемости клиентов после пересадки органовАккуратный подбор донора и реципиента продлевает срок жизни клиентов и существенно улучшает её качество Jonathan CrookProfessor of Business Economics & Director, MSc Banking & Risk,Edinburgh Christophe MuesSenior Lecturer of Southampton Management School,Southampton .....и многие, многие другие активно исследуют применении Анализа Выживаемости в кредитном скоринге и CRM
ОСНОВНЫЕ определения Событие: некий триггер, сработавший на «клиенте» Цензурирование: выбывание из наблюдаемой выборки под действием сторонних факторов переезд в другой город, окончание эксперимента до наступления события, смерть Ковариаты: характеристики «клиента», влияющие на его «отток» возраст, пол, город, а также динамика дохода, динамика курсов валют, ... ФУНКЦИЯ ВЫЖИВАЕМОСТИ ФУНКЦИЯ РИСКА
цензурирование Конец наблюдений А что случится с ними? Этого никто не знает Начало наблюдений
Kaplan-Meier Model Количество выбывших в интервал времени T (number at death) Количество под угрозой выбывания(number at risk)
Kaplan-Meier Model : COMPARING SURVIVAL CURVES Confidence Limits • Different Statistical Tests • Log Rank • Wilcoxon • Likelihood-Ratio
Kaplan-Meier Model : DIFFERENT STATISTICAL TESTS Log Rank Wilcoxon Likelihood-Ratio(parametric) Distribution of Event times Exponential
PROC LIFETEST: COMPARING SURVIVAL CURVES Are HazardFunctionsproportional? DoesLikelihood-Ratio test applicable? YES NO
PROC LIFETEST: COMPARING MULTIPLE SURVIVAL CURVES proclifetestdata=sasuser.methadone plots=(survival(cb=hw)) notable; time time*status(0); strata dose(5070) / test=logrank adjust=scheffenodetail; run;
PROC LIFETEST: COMPARING MULTIPLE SURVIVAL CURVES proclifetestdata=sasuser.methadone plots=(survival(cb=hw)) notable; time time*status(0); strata dose(5070) / test=logrank adjust=scheffenodetail; run; Dose < 50 and Dose =60 differ? NO Dose > 70 and Dose =60 differ? YES Dose > 70 and Dose <50 differ? YES
Alternative to Kaplan-meier: life table methods LIFE TABLEthe same as Kaplan-Meier Estimate, but … CENSORED OBS ARE CENSORED IN THE MIDDLE OF INTERVAL GROUP OBSERVATIONS INTO BINS LARGE SAMPLES
Alternative to Kaplan-meier: life table methods proclifetestdata=sasuser.methadone plots=(survival(failure) hazard) method=life intervals=183365548; time time*status(0); strata clinic / test=(all) nodetail; run;
SURVIVAL MODELS • Models in Survival Analysis are written in terms of Hazard Functions • They assess the relationship of covariates to survival times • Models can be parametric or semi-parametric PARAMETRIC PROC LIFEREG SEMI-PARAMETRIC PROC PHREG Distribution of Event Times is specified Hazard function is completely specified (except for params) Distribution of Event Times is unknown Hazard function is unspecified Cox Proportional Hazards Model OK for ! Exp Hazards Weibull HazardsUsually a poor choice!
Cox proportional hazards model The model provides the primary information desired from a survival analysis Minimum of assumptions Robust regression estimates of the influence of covariates Thus, the model is extremely popular
Deriving coefficients: partial likelihood maximization ILLUSTRATION
TIED OBSERVATIONS Tied observations They must be taken into account in Partial Likelihoodcalculation! SAS/STAT PROC PHREGdoes it automatically! (Breslow approximation)
PROC PHREG: FIT COX REGrEssion model to methadone data COEFFICIENTESTIMATE COEFFICIENT not equal to 0?
Cox PH Model assessment COX MODEL ASSUMPTIONS Proportional HazardsThe effect of the predictor is the same over all values of time LinearityLog Hazard linearly depends on predictors AdditivityThe joint effect of predictors equals the sum of their separate effects TIME-VARIABLE DEPENDENCE CUMULATIVE RESIDUALS PLOT
Assess PH using cumulative residuals plot RESIDUAL Simulated Observed SIMULATE IT!
MODELIng non-proportional hazards WAYS to HANDLE NON-PROPORTIONAL HAZARDS Stratified Cox PHVary Baseline hazard Cox PH with time-dependent varsModel non-proportionality using interactions with functions of time Piecewise Cox PHThe effect of variable is assessed separately for different times
STRATIFIED COX MODEL 1. Dose*Clinic & Clinic*Prison DROP Dose*Clinic 2. Clinic*Prison DROP Clinic*Prison
STRATIFIED COX MODEL 3. No interactions STAY at this model complexity 4. Try to adjust Baseline Hazard by Clinic
Models with interactions with time 2 WAYS of INTRODUCING TIME INTO PARAMETER ESTIMATES Change the effect βof the variable Change the variableitself
PIECEWISE COX MODEL CREATE INTERACTION with HEAVISIDE FUNCTION!
TIME-dependenT COVARIATES New time-dependent covariates must be specified inside PROC PHREG procphregdata=sasuser.methadone; class Clinic (param=ref ref='2'); model Time*Status(0)=Clinic Dose Prison Drink / ties=exact rl=pl; Drink=(0 <= DrinkStart < Time); run;
Modeling the effect of time-dependent predictors «Drink» is time dependent and it’s important! Coefficients are the same for the whole survey period
REPEATED EVENTS Some events are intrinsically repeatable: pregnancy, infection One should account for this in survival analysis
REPEATED EVENTS: different models for succ events Model men’s muscle soreness in 4 intervals depending on age and treatment 1. 2. 3. Drop 4. Drop Build different survival models for successive events