1 / 16

Spline cúbico natural (B-spline) usando cuantiles

Spline cúbico natural (B-spline) usando cuantiles. Se elige un “array blanco”(“array basal”), v. Intensidad blanco:. i: spot, j: array, m: nº de arrays. X puede ser R o G. Se extraen 100 percentilos para cada array (incluso el target), se desestima el resto de los datos. target. array.

Download Presentation

Spline cúbico natural (B-spline) usando cuantiles

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Spline cúbico natural (B-spline) usando cuantiles Se elige un “array blanco”(“array basal”), v Intensidad blanco: i: spot, j: array, m: nº de arrays X puede ser R o G

  2. Se extraen 100 percentilos para cada array (incluso el target), se desestima el resto de los datos target array

  3. Se ajusta una función spline cúbica natural sj = f(cuantil xj, cuantil v) para cada array j Definición spline: es una función polinomial fragmentada en intervalos S: [a,b] → Rd consite en la piezas polinómicas Pi: [ti,ti+1) → Rd donde a = t0 < t1 < … < tk-1 = b Spline natural: spline de grado 3 con continuidad C2. “Natural” porque: En nuestro caso definimos al spline para el intervalo k, array j:

  4. Se puede calcular con R o S-plus. Se minimiza: (S-plus)

  5. Selección de un set invariante: • Se calcula para cada array a los rangos de intensidad correspondientes al spot i (ria) • Selección del set invariante: • PRDi = ( ri1 – ri2 ) / n < 0.003 ó 0.007 • Obtenemos un nuevo set y repetimos • Paramos cuando no decrece más el tamaño del set • Se aplica spline usando como “array basal” al set invariante

  6. Normalización de escala

  7. Datasets

  8. Inspección visual Bias local Bias global

  9. MA plots (lymphoma)

  10. Clasificación k-NN • Suficientemente sensible para evaluar la pérdida de variabilidad biológica • Disponible en varios paquetes • Empíricamente aceptables • No hace suposiciones sobre la distribución • Algoritmo sencillo • Se aplico a TODOS los spots (sin selección) • Los artefactos son más fáciles de detectar • Se incluyeron spots de baja intensidad ¡porque son importantes también! Validación cruzada por “LOOCV”

  11. Conclusiones • Métodos simples mejoran los datos • Métodos dobles mejoran a los simples • IGLOESS-SLFILTERW7, ISTSPLINE-SLLOESS y IGLOESS-SLLOESS fueron los mejores • La elección del mejor método aún depende mucho del array (artefactos, verdaderas diferencias biológicas?) • Normalización de escala no tiene efectos benéficos • La normalización tiene un impacto fuerte en el subsiguiente análisis

  12. Software • R language • Bioconductor http://www.bioconductor.org • MAANOVA • http://www.jax.org/staff/churchill/labsite/software/download.html • tRMA http://www.pi.csiro.au/gena/tRMA • braju http://www.maths.lth.se/help/R/aroma

More Related