360 likes | 857 Views
Modello di Cox. E’ un modello di regressione che esplora la relazione tra la hazard e ipotetiche determinanti .
E N D
ModellodiCox • E’ un modellodiregressionecheesplora la relazionetra la hazard e ipotetichedeterminanti. • L’assunzioneprincipale è chel’effettodelledeterminantisiaproporzionale, se assumiamo un soggettoi come baseline, misuriamodiquanto le determinanti relative ad un altrosoggettoaumentano la hazard. NON è NECESSARIO determinareilvalorenumericodellabaseline • Quindimisurailrischio RELATIVO, non quelloassoluto • NON è necessariospecificare la baseline
Assunzioni del Modellodi Cox • Gli hazards sonoproporzionali:ilrischiodiogniindividuo è unaproporzionefissa del rischiodiognialtroindividuo (parzialerevisionediquestaipotesi in seguito) • Quindisiparladi “Multiplicative risk”
Modello di Cox • Dove λ(t,z) è la hazard al tempo t per ilsoggettoche ha covariate z=(z1,z2,….,zp) • λ0(t) è la baseline cioè la hazard di chi ha z=(0,0,0,0,…0) • βiMisural’effettomoltiplicativo de covariata I, è un coefficientediregressionestimato via max verosimiglianza (bi) PARZIALE (dopo)
Per nisurarel’effettorelativo non è necessariospecificare la λ0(t) • Supponiamoλ0(t) = A (baseline) • Un modello con una sola covariata X • Un coefficientestimato = 0.5 • 2 soggetti con X=7 e X=4 • Il rapportotragli hazard, cioè la misuradell’effettodella X sulla baseline non contiene la baseline (A)
Hazard persona i (esfumatore) Hazard persona j (es. Non-fumatore) In simboli hazards proporzionali: Hazard ratio Implica Hazard functions parallele! Misurailrischio “aggiustato” per le altrevariabili
Consideriamo un modello “semplice” • Il rapporto tra gli hazard, cioè la misura dell’effetto della X sulla baseline non contiene la baseline (A)
In sostanza si tratta di stimare il modello senza intercetta il che significa rinunciare a specificare la “forma del rischio “base” Un incremento unitario di x aumenta il rischio di circa il 65%, qualunque sia la forma e l’entità della “baseline”
In generale: • Se UNA covariata aumenta di una unità, rispetto al valore precedente il rapporto tra gli hazard è: • Quindi ogni β è il logaritmo dell’incremento di hazard che si verifica in corrispondenza di un incremento unitario della rispettiva covariata
Interpretazione dei coefficienti • Un coefficiente>1 indica che la covariata incrementa il rischio • Un coefficiente<1 indica che la covariata diminuisce il rischio • Un coefficiente=1 indica che la covariata e il rischio sono indipendenti
Come si leggono i βj? • Se una covariata aumenta di una unità, rispetto al valore precedente il rapporto tra gli hazard è: • Quindi β è il logaritmo dell’incremento di hazard che si verifica in corrispondenza di un incremento unitario della covariata
Consideriamo un predittorebinario(fumatore/non fumatoredi 60 anni) Questo è ilrischiodi un fumatore, aggiustato per l’età
Consideriamo un predittore continuo (età) Questo è l’hazardratio per un incrementodi 10 annidietà, aggiustato per l’abitudine al fumo. Exp (coefficiente) misural’hazardratio corrispondente ad un incrementounitario del predittore continuo.
The “Partial Likelihood” (PL) Quandocisonom TEMPI DI EVENTO e Li è partial likelihood per ilithtempo: Definiamoverosimiglianzaparziale:
Il “risk set” Datoche un eventosiverifica al tempo =3, questa è la probabilitàchecapiti al soggetto 2 piuttostoche a tuttiglialtriancoranellostato, cioè a rischio. La verosimiglianzadi un singoloevento: Consideriamoquestidatididurata Uomini: 1, 3, 4, 10+, 12, 18 (indichiamo con j=1-6 I soggetti) Nota: nella ML c’è un termine per ciascunevento NON per ciascunindividuoiltermine al numeratoreindicail NUMERO di EVENTI
Se sostituiamo la h con la suaformulazionesecondo COX la PL diventa
Dove è l’indicatoredellacensura e (1=conclusa, 0 se censura) e R(ti) è il risk set al tempo ti La PL Metodi di stima e test usuali per MLE
Esempio: var.dip. Durata del contratto con gestore telefonico Stima: • Il rischio di scissione del contratto per un celibe è 1,5 volte quello di un coniugato • Ogni anno di permanenza all’indirizzo attuale riduce il rischio del 100%-(100%x0.941)=5.9% • Ogni anno di occupazione riduce il rischio del • 100%-(100%x0.920)=8.0%
Hazard persona i (esfumatore) Hazard persona j (es. Non-fumatore) Test sullaproporzionalitàdegli hazard: Riprendiamol’ipotesidi hazards proporzionali: Hazard ratio
Cambiosegno e log dinyuovo Cioè: ilog(-log) delle survival are parallel, e differenti per log(HR) CONDIZIONE SOGGETTA A TEST Il test sibasasulconfrontotra le survival
Coeficientediinterazionecol tempo Covariatamoltiplicata per t Modellodi Cox con Hazard non proporzionali La violazionedellaipotesidiproporzionalità è equivalente ad ammetterechealcune covariate modificanoilloroeffetocol tempo, hannounainterazionesignificativacol tempo Se ilcoefficientediinterazionecol tempo è signidicativo, indica non-proportionalità, e allostesso tempo la inclusionenelmodellocorregge la non proporzionalità! Valoripositivi (negativi) indicanochel’effettodella x cresce (decresce)linearmentecol tempo. Questo introduce ilconcettodi time-dependent covariate
Time-dependent covariates, Esempio • Per esempio, valutiamol’effettodell’etàsulperiodocheintercorretra 2 acquisti di un certoprodotto • Questi I dati di partenza: • 1000 soggettiosservati per 12 mesi (hannoeffettuatoalmeno un acquisto) • di questi • 647 hannori-acquistato • 353 No (censurati)
La stima Cox fornisce il seguente risultato: B SE Wald df Sig. Exp(B) age -,055 ,006 96,683 1 ,000 ,946 Ma se osserviamo I residui…(naturalmente solo per I NON censurati) scopriamoche non sono del tutto “random” In particolarec’èilsospetto di unacorrelazionenegativa…
Quindi creaiamouan nuova variabile “timedependent” motiplicando l’età per il periodo di riacquisto (T_cov) La stima è: Variabili nell'equazione B SE Wald df Sig. Exp(B) age -,026 ,010 6,346 1 ,012 ,975 T_COV_ -,007 ,002 10,736 1 ,001 ,993 Il coefficiente della variabile “timedependent” è significativo, quindi i rischi non sono proporzionali Tuttavia, specificata correttamente la “forma” della dipendenza temporale, e inserita la variabile time-dep, il modello di Cox fornisce stime corrette Si noti la differenza nell’effetto della variabile “age” con e senza T-cov: Ogni anno di età in più diminuisce la probabilità di riacquisto del -5,4% nel primo caso e solo del -2,5% nel secondo!