520 likes | 659 Views
La mida de les bactèries i la distribució skew-Laplace. Olga Julià Dpt. Probabilitat, Lògica i Estadística UB. La mida de les bactèries i la distribució skew-Laplace. Introducció Les dades Flow citometer Multisizer II La distribució skew-laplace Estimació dels paràmetres Interpretació
E N D
La mida de les bactèries i la distribució skew-Laplace Olga Julià Dpt. Probabilitat, Lògica i Estadística UB
La mida de les bactèries i la distribució skew-Laplace • Introducció • Les dades • Flow citometer • Multisizer II • La distribució skew-laplace • Estimació dels paràmetres • Interpretació • Ajust. Valoració qualitativa i quantitativa • Resultats • Bibliografia
Introducció • La distribució de la mida de les partícules és un problema que sorgeix en molts àmbits de la ciència com: • Arqueologia grans de sorra • Medicina plaquetes • Geologia diamants • Agricultura tomàquets • Biologia organismes unicel·lulars
Introducció • Distribució log-hiperbòlica: Barndorff-Nielsen 1977. • Aquesta distribució té quatre paràmetres. • Dóna problemes computacionals. • Dificultat d’interpretar els paràmetres.
Introducció • Distribució skew-Laplace o log-skew-Laplace: Fieller 1992 • Distribució amb tres paràmetres • Fàcil d’interpretar • Estimació pel màxim de versemblança
Les dades • Estudi de la mida i l’estructura de diferents tipus de bactèries. • Es procedeix als cultius en determinades condicions fixades pels microbiòlegs, i amb l’ajut de dues màquines es fan tres mesures. Els aparells utilitzats són: • Flow cytometer • Multisizer II (analitzador electrònic de partícules)
Flow cytometer • Forward scatter. Sensor que mesura la llum dispersada per la partícula a un angle petit (entre 2 i 11 graus) d’un feix de làser incident. La sensibilitat de l’aparell és suficient per detectar partícules de grandària 0.5mm. • Side scatter. Sensor que mesura la llum dispersada per la partícula a un angle de 90 graus aproximadament respecte el feix làser • El FS està relacionat amb la grandària de la cèl·lula, mentre que el SS està relacionat amb la granulositat
Flow cytometer • Dos tipus de mesures: Forward scatter (FS) i Side scatter (SS).
Multisizer II • Analitzador electrònic de partícules amb un tub d’obertura de 30mm. Un comptador mesura les cèl·lules conforme passen pel tub. De la transformació dels impulsos elèctrics generats pel comptador s’obtenen tres quantitats: diàmetre, volum i superfície de revolució.
Les nostres dades • Les dades vénen donades en taules de freqüències: • Les poden ser canals o diàmetres.
La distribució skew-Laplace • Aquesta distribució té per densitat • Si prenem logaritmes, tenim dues rectes
La distribució skew-Laplace • Els paràmetres tenen fàcil interpretació: • La moda • El pendent de la primera recta • El pendent de la segona recta - • Cas simètric m=120, a=0.06b=0.12
Estimació dels paràmetres • Prenent logaritmes de les freqüències i ajustant a dues rectes • Pel màxim de versemblança. En aquest cas l’estimació té dos passos: a ) estimar primer b ) estimar i utilitzant l’estimació de
Paràmetre • Considerem les funcions:
Paràmetre • El màxim de versemblança es troba en el valor que minimitza la funció h avaluada en els punts sempre i quan no coincideixi ni amb el màxim ni amb el mínim. En aquest cas el màxim de versemblança no existeix.
Paràmetres i • Una vegada tenim l’estimador del primer paràmetre, , els altres dos estimadors es troben per la fórmula
Mixtura de Normals • La distribució de Laplace es pot considerar una mixtura de Normals. • Sigui W una exponencial de paràmetre 1 i Z una Normal estàndard independent de W, aleshores X és una Laplace
Interpretació de la skew-Laplace • Per la distribució skew-Laplace podem donar una interpretació similar, només que ara la mitjana també és aleatòria: • On W és una exp(1) i Z una N(0,1) independent de W.
Ajust • Una vegada determinat el procés per a fer les estimacions vaig construir un programa en MatLab per que les calculés. • El sofware disponible no em permetia treballar amb una mostra tan gran (10.000)
L’ajust, funciona? • Al dibuixar l’histograma i la densitat de la skew-Laplace estimada es fa palès que alguns ajustos són molt bons
L’ajust, funciona? • Altres no són tan bons però podem considerar-los acceptables
L’ajust, funciona? • Alguns ajustos podríem dir que són dubtosos.
Ajust • Però en tots els casos les proves de bondat d’ajust (Kolmogorov, c2 , Cramer-Von Misses..) refusen clarament la distribució de skew-Laplace. • Problema: la gran quantitat de dades. No hi ha cap prova d'hipòtesis que aguanti 10.000 dades.
Valoració quantitativa de l’ajust • El q-q plot ens dóna un criteri gràfic, però per poder comparar bé la bondat de l’ajust ens cal un valor quantitatiu. • Fieller et al. (1992) en el seu article “Statistics of particle size data” proposen un estadístic que representa la talla màxima de la mostra que la prova d’ajust de la khi-quadrat permet acceptar al 5%
Valoració quantitativa del ajust • En concret, l’estadístic que proposen és: • On: k representa el nombre d’intervals m el nombre de paràmetres estimats freqüència relativa de la classe i estimació de la probabilitat de la classe i
Valoració quantitativa del ajust • Per tal d'homogeneïtzar el procés, vaig agafar sempre 40 intervals amb la mateixa probabilitat estimada. • Segons em va fer observar el Pere Puig,el test de la khi-quadrat, a causa de l’estimació del màxim de versemblança, dóna una variable khi-quadrat que té entre k-1 i k-m-1 graus de llibertat. Donat que m=3 i k=40 la diferència és irrellevant.
Valors Ncrit Ncrit=1224 Ncrit=587 Ncrit=186
Resultats • Skew-Laplace distribution in Gram negative bacterial axenic cultures: new insights into intrinsic cellular heterogeneity. Microbiology p. 749-755 (2005). • The flow cytometric scatters of bacterial axenic cultures fit the skew-Laplace distribution pattern: biological consequences.
Primer article • Es va treballar amb dos tipus de bactèries: • Escherichia coli, amb quatre temps d’incubació: 2h, 5h, 24h i 48h. • Les soques 31 i 41 extretes del intestins de ratolins de la raça Mus musculus. En aquest cas el temps d’incubació va ser 48h.
Primer article • Per a cada tipus de bactèries i en cada temps es van fer tres anàlisis diferents: • control. • amb sonicació • amb sonicació i detergent
Primer article • En tots els casos es van prendre tres mesures: • FS (Forward scatter) • SC (Side scatter) • Diàmetre (Multisizer II)
Skew-Laplace E.Coli 24h Cepa 41 24h Cepa 31 24h
Log Skew-Laplace E.Coli 24h Cepa 41 24h Cepa 31 24h
Conclusions • El SS està relacionat amb la granulositat i aquesta amb la densitat ribosòmica. Com més ribosoma més activitat cel·lular. • El fet que la skew-Laplace (que té les dues cues diferents) ajusti bé el SS fa pensar en dues subpoblacions “independents”.
Segon article • Es va treballar amb 28 tipus de bactèries, i amb tres temps d’incubació: 6h 20h i 36h. • A més per a tres d’elles (Escherichia coli, Staphylococcus aureus i Bacilus subtilis) es van analitzar en quimiostat a diferents concentracions.
Segon article • Aquí ens vam trobar amb resultats diferents pel que fa a l’ajust, ja que no sols el SS es comportava bé, sinó que el FS també es va ajustar en molts casos. • La justificació la podríem trobar en el canvi d’aparell, que és més sensible.
Conclusions • La skew-Laplace és un model efectiu per a quasi tots els cultius bacterians mesurats pel Flow cytometer mentre que no és de clara extensió per l’analitzador electrònic de partícules. • El fet que la skew-Laplace no ajusta millor pels cultius quimiostat indica que l’ajust no es pot lligar a l’heterogènesi bioquímica o morfològica.