Calibración multivariada Parte 4 - PCR

Calibración multivariada Parte 4 - PCR Alejandro C. Olivieri Departamento de Química Analítica Instituto de Química Rosario (CONICET) Facultad de Ciencias Bioquímicas y Farmacéuticas Universidad Nacional de Rosario ARGENTINA

Regresión en componentes principales (PCR)

Scores significativos Scores poco significativos Matriz de scores PCA Análisis de componentes principales Matriz de datos de calibración

2  100 1000 × 100 98  100 PCA Análisis de componentes principales Información comprimida

Análisis de componentes principales Pearson, K, Principal Components Analysis, The London, Edinburgh and Dublin Philosophical Magazine and Journal, 6, 566, (1901).

Precursores del análisis de componentes principales Eugenio Beltrami, 1873 Camille Jordan, 1874

Variables latentes Variables explícitas Descomposición matricial mediante PCA U Matriz de autovectores de XTX X Matriz de calibración T Matriz de scores X = U  T

Clasificación de autovectores en PCA Significativo Poco significativo

Clasificación de autovectores en PCA U Matriz de autovectores de XTX Significativos Poco significativos

Descomposición matricial mediante PCA Se seleccionan únicamente los autovectores y scores significativos

Descomposición de la matriz con unos pocos autovectores XA Matriz de calibración reconstruida con A factores UA TA Matriz de los Ascores más significativos Matriz de los A autovectores más significativos XA = UA TA

Imagen original: A=1 A=2 A=4 A=16 A=32 A=8 Ejemplo de reconstrucción matricial Imágenes reconstruidas

La matriz TA es considerablemente menor en tamaño que la matriz original de datos X, ya que en general el número de factores es muy inferior al de longitudes de onda. • Sin embargo, la matriz TA contiene virtualmente la misma información que X. • Por lo tanto, podría reemplazarse X por TA en la calibración de un modelo sin pérdida significativa de información.

Regresión en componentes principales (PCR) 1) Compresión de las señales mediante análisis de componentes principales y cálculo de scores significativos. 2) Calibración inversa (del tipo ILS), reemplazando las señales por los scores. PCR = PCA + ILS

Regresión en componentes principales (PCR) • 1) Compresión de la información de calibración • PCA: Calcular los scores T • AScores:Seleccionar TA(formada por las primeras A columnas de T) • 2) Modelo ILS que relaciona los scores de calibrado con las concentraciones del analito • yn= TAvn+ e

Regresión en componentes principales (PCR) Etapa de calibración

Ventaja adicional de la regresión en componentes principales El cálculo de los coeficientes de regresión requiere la inversión de una matriz. En ILS la inversión se complica si los espectros de las diferentes muestras son similares entre sí. En PCR no existe este problema, porque los “espectros” son reemplazados por los scores. Los scores son ortogonales entre sí, de modo que la inversión de la matriz es siempre posible.

Regresión en componentes principales (PCR) En PCR se cumple fácilmente que el número de factores es menor que el número de mezclas de calibrado. En PCR la matriz de scores se invierte fácilmente.

Regresión en componentes principales (PCR) Etapa de predicción Los coeficientes de regresión de la etapa de calibrado se emplean para la predicción de la concentración del analito en la muestra, reemplazando la señal de la muestra por sus scores.

Regresión en componentes principales (PCR) Etapa de predicción Scores de la muestra

Regresión en componentes principales (PCR) Revisión de la etapa de predicción El espectro de la muestra puede reconstruirse con los scores de la muestra y los autovectores, para dar una aproximación xA. Errores de ajuste para diagnóstico de outliers: eA = xA x

Residuos espectrales y detección de componentes inesperados ej ej Long. de onda Long. de onda Ausencia de componentes inesperados sres≈ Ruido Presencia de componentes inesperados sres>> Ruido

Regresión en componentes principales (PCR) Revisión de la etapa de predicción También puede reconstruirse el vector de coeficientes de regresión bn, a partir de del vector vn calculado en la etapa de calibrado de PCR

Coeficientes de regresión Vector bn Long. de onda yn = bn1x1 + bn2x2 + … + bnJ xJ

Regresión en componentes principales (PCR) • Ventajas: • Espectros completos • Calibración inversa (sólo deben conocerse algunos componentes calibrados) • Residuos espectrales (ventaja de primer orden) • Poco sensible a la colinealidad espectral por el uso de scores ortogonales • Factores que expresan la máxima variancia espectral

Raw calibration Predicted vs. actual Raw unknowns 2 2 20 Ideal 1.5 1.5 Real 15 1 1 Predicted 10 0.5 0.5 Slope = 0.99395 SD = 0.013326 0 0 5 Intcp = -0.083437 SD = 0.13548 -0.5 -0.5 5 10 15 20 20 40 60 80 100 120 20 40 60 80 100 120 Actual Análisis de biodiesel en mezclas con gasoil mediante espectros NIR y PCR en la región completa de 120 sensores (5940-7368 cm-1) 120 sensores Error relativo de predicción (A = 9): 5.5 %

¿Qué puede ser mejor que la regresión en componentes principales?

Calibración multivariada Parte 4 - PCR

Calibración multivariada Parte 4 - PCR

Presentation Transcript

PCR

PCR

CFR 1926. 550 Sub-parte N

PCR

PCR

PCR

PCR and qRT-PCR

PCR

ANÁLISE DE VARIÂNCIA MULTIVARIADA - MANOVA

Parte II: La Proposici n

GEOESTADISTICA MULTIVARIADA

Análise multivariada na agricultura

PCR

PCR

PCR

PCR

Section 4 Lesson 3 – PCR

PCR

PCR

Unidad 4 Primera parte

PCR.

PCR