160 likes | 332 Views
Spline cúbico natural (B-spline) usando cuantiles. Se elige un “array blanco”(“array basal”), v. Intensidad blanco:. i: spot, j: array, m: nº de arrays. X puede ser R o G. Se extraen 100 percentilos para cada array (incluso el target), se desestima el resto de los datos. target. array.
E N D
Spline cúbico natural (B-spline) usando cuantiles Se elige un “array blanco”(“array basal”), v Intensidad blanco: i: spot, j: array, m: nº de arrays X puede ser R o G
Se extraen 100 percentilos para cada array (incluso el target), se desestima el resto de los datos target array
Se ajusta una función spline cúbica natural sj = f(cuantil xj, cuantil v) para cada array j Definición spline: es una función polinomial fragmentada en intervalos S: [a,b] → Rd consite en la piezas polinómicas Pi: [ti,ti+1) → Rd donde a = t0 < t1 < … < tk-1 = b Spline natural: spline de grado 3 con continuidad C2. “Natural” porque: En nuestro caso definimos al spline para el intervalo k, array j:
Selección de un set invariante: • Se calcula para cada array a los rangos de intensidad correspondientes al spot i (ria) • Selección del set invariante: • PRDi = ( ri1 – ri2 ) / n < 0.003 ó 0.007 • Obtenemos un nuevo set y repetimos • Paramos cuando no decrece más el tamaño del set • Se aplica spline usando como “array basal” al set invariante
Inspección visual Bias local Bias global
Clasificación k-NN • Suficientemente sensible para evaluar la pérdida de variabilidad biológica • Disponible en varios paquetes • Empíricamente aceptables • No hace suposiciones sobre la distribución • Algoritmo sencillo • Se aplico a TODOS los spots (sin selección) • Los artefactos son más fáciles de detectar • Se incluyeron spots de baja intensidad ¡porque son importantes también! Validación cruzada por “LOOCV”
Conclusiones • Métodos simples mejoran los datos • Métodos dobles mejoran a los simples • IGLOESS-SLFILTERW7, ISTSPLINE-SLLOESS y IGLOESS-SLLOESS fueron los mejores • La elección del mejor método aún depende mucho del array (artefactos, verdaderas diferencias biológicas?) • Normalización de escala no tiene efectos benéficos • La normalización tiene un impacto fuerte en el subsiguiente análisis
Software • R language • Bioconductor http://www.bioconductor.org • MAANOVA • http://www.jax.org/staff/churchill/labsite/software/download.html • tRMA http://www.pi.csiro.au/gena/tRMA • braju http://www.maths.lth.se/help/R/aroma