380 likes | 496 Views
Qualimetrics : PLS , NN a regres ní model y v řízení kvality. REQUEST 2006 Karel Kupka, TriloByte, Pardubice, Czech Republic Centrum pro jakost a spolehlivost CQR Grant 1M MŠMT: 1M06047. Příklad datových bází a možnosti modelování vztahů s vyznačenými toky informací.
E N D
Qualimetrics:PLS, NN a regresní modelyv řízení kvality REQUEST 2006 Karel Kupka, TriloByte, Pardubice, Czech Republic Centrum pro jakost a spolehlivost CQR Grant 1M MŠMT: 1M06047
Příklad datových bází a možnosti modelování vztahů s vyznačenými toky informací
Metody kvalimetrie, možnosti PLS • Data vystupující v technologiích jakosti mají téměř vždy vícerozměrný charakter, protože představují několik hodnot měřených současně nebo na jednom produktu. Metody analyzující taková data jako celek se proto nazývají vícerozměrné. Vycházejí z datových tabulek, které jsou obvykle k dispozici v excelu, nebo databázi. Tyto tabulky obsahují například vlastnosti vstupních surovin a okolností, naměřené, nebo nastavené hodnoty sledovaných veličin v různých fázích výrobního nebo obchodního procesu. Některé veličiny představují parametry jakosti. Nejjednodušší představa zahrnuje tabulky • Vstupních dat (suroviny, zdroje, dodavatelé, vstupní přejímky), • Procesních dat (výrobní podmínky, procesní parametry, mezioperační kontroly), • Výstupních dat (specifikace, parametry kvality produktu, hodnocení odběratele).
Metodika a metody PLS Metody PLS jsou založené na syntéze principu příbuzném metodě hlavních komponent (PCA) a vícenásobné lineární regrese. Tato matematická metoda je využívána v ekonometrii, chemometrii, biometrii a v poslední době se objevují aplikace v kvalimetrii. Cílem metody je odhalit vztahy mezi vícerozměrnými daty v databázích a využít této znalosti k přibližnému výpočtu hodnot jedné skupiny veličin z druhé. Podstata Metody PLS Tabulku naměřených hodnot p veličin (sloupců) s n řádky označme jako matici X(n x p), a odpovídající tabulku se stejným počtem řádků n ale s q veličinami označme Y(n x q), Abychom extrahovali maximum informace z p- a q- rozměrných matic do prostoru s nižší dimenzí k, rozložíme X a Y na ortogonální matice T (n x k) a U (n x k), s koeficienty P a Q X = TP + E Y = UQ + F
T (n x k), U (n x k), k min(p, q). Zajištění maximální relevance X-komponent pro Y, tyto transformace maximalizují kovariance mezi T a U. Dimenzionalita T a U je typicky menší než X a Y a sloupce T a U jsou ortogonální. To zlepší stabilitu modelu. Šum a irelevantní informace se koncentruje v „popelnicích“ E a F. Je-li k = p, pak E = 0. Dekompozice U = TB (B je čtvercová diagonální matice) poskytuje nástroj pro predikci Y z X: Y = TBQ T = XP- Kombinací tohoto a předchozích vztahů je zřejmý vztah (vnitřní lineární vazba mezi X a Y. U = TB BQ = R X = TP + E Y = TR + F T se konstruuje z nových dat X. Protože T = XP–, Y = XP–BQ, a tedy P–BQ reprezentuje originální (obecně vychýlené a zkrácené – tedy stabilnější) regresní parametry modelu Y = XA.
P X T E = + Q Y U F = + PREDIKCE X Y
Na rozdíl od klasické lineární regrese jsou v PLS X a Y rovnocenné, tedy zaměnitelné – je jedno, kterou matici označíme X a kterou Y. Proto lze predikovat Y z X stejně jako X z Y. Je tedy PLS rovněž často používaným nástrojem pro lineární vícerozměrnou kalibraci. Y X
Vícerozměrná kalibrace Chemické složení (koncentrace, pH) Spektrum (absorbance)
Zkrácený postup iterativního výpočtu PLS E = X; F = Y Krok 1. w ~ ETu (odhad X vah) Krok 2. t ~ Ew (odhad X skórů) Krok 3. q ~ FTt (odhad Y vah) Krok 4. u = Fq (odhad Y skórů) E = E – tTp; F = F – tTb q (oprava E,F)
Některé aplikace billineárních modelů Technologie: Procesní parametry Fyzikální vlastnosti Technologie: Procesní parametry Fyzikální vlastnosti Proces/chemické složení Sensoric/Quality parametry Vstupní faktory Výstupní kval/kvant -itativní vlastnosti Procesní podmínky Výstupní kval/kvant -itativní vlastnosti Toxicology: Composition/Structure Toxicity Health: Chemical Structure Bioeffects Pollution: Composition Origin/Source Pollution: Composition Human health effects Environment: Environmental factors Species diversity
Aplikace: Vlastnosti hliníkové slitiny Chemické složení Fyzikální vlastnosti
Aplikace: Vlastnosti piva Y X
Bi-Plot v PLS Dekompozice TP a UQ se dají využít pro konstrukci společného grafu skórů a zátěží Bi-Plot, který umožní omezené posouzení dat a proměnných pro X i Y.
„Predikce prediktorů“ Požadované vlastnosti, X T = XP- Y = TBQ Predikované složení, Y
Neuronové sítě Aplikace NN jako statistického predikčního modelu
Inspirace neuronové sítě • Jádro • Dendrity-dostředivé výběžky • Axon-neurit • Synaptické přípojky pro předání vzruchu
Model neuronu a aktivační funkce Nejjednodušší aktivační funkce Rosemblatt 1962 – učící algoritmus PERCEPTRON složený z modelů neuronu ve dvou vrstvách (vstupní a výstupní). Vstupní vrstva dostává data z okolí a výstupní vrstva posílá informace ze sítě ven.Každý vstupní neuron je přímo spojen se všemi výstupními (vstupy a výstupy jsou binární –1,1). Perceptron dokáže řešit úlohu lineárně oddělitelné klasifikace. Pro lineárně neoddělitelné klasifikace pomocí perceptronů nefunguje
Jednovrstvá neuronová síť z = xi.wij σj+1, i (z) = 1/(1 + e– z) zi = a0 + Σaij zi-1,j Vstupní veličina xi je po normalizaci vážena vahou wji a v neuronu transformována aktivační funkcí σj+1, i (z) = 1/(1 + e – z), kde z je lineární kombinace vstupních veličin, zi = a0 + Σaijzi-1,j. Váhy wji představují vazbu mezi vstupní hodnotou a neuronem.
Vícevrstvé neuronové sítě Mc Clelland a Rumelhart 1986 trénování vícevrstvých ANN pomocí Backpropagation-BP (zpětné šíření). Možno řešit problémy lineárně neoddělitelné klasifikace.
Postup použití NN • Volba vhodné struktury sítě (architektura) • Trénování sítě na změřených datech (učení) • Predikce pomocí NN
Návrh a trénování NN • Počet skrytých vrstev • pro většinu problémů stačí jedna • zvětšování počtu vede k výraznému nárůstu počítačové náročnosti • Počet neuronů ve skryté vrstvě • rámcové pravidlo, že postačuje přirozený logaritmus počtu vstupů • Architektura • nejběžnější je plně propojená dopředná síť, logistická AF • Velikost trénovací množiny • postačující pro zobecnění a zaplnění prostoru dat • při menším počtu dojde ke kopírování všech informací (interpolace) • Možnost použití crossvalidace • Počet vstupů • odstranění parasitních proměnných je nezbytné • Standardizace vstupů • standardizace zlepšuji rychlost učení
Optimalizace NN Minimalizace součtu čtverců odchylek Vstup do výstupní vrstvy (uvažuje se pouze jeden výstup) je vážený součetvšech aktivačních funkcí ve tvaru Predikce Cílem je nalézt váhy wji j = 1,…M, i = 1,…m, a Wj j = 1…M. Jde tedy o celkem M*(m+1) parametrů. To je vzhledem ke tvaru kritéria K řešitelné pomocí derivačních algoritmů nelineární regrese.Pokud označíme aktivační funkci symbolem F(.), lze kriteriální podmínku K pro určení vah vyjádřit ve tvaru
Pro řešení optimalizační úlohy pro Wij lze použít jednoduchou iterativní metodu založenou na výpočtu gradientu, kdy pro přírůstek platí
Aplikace NN pro predikci optických vlastností pigmentu Ln2 Zr(2-x) Mx O7 Ln = lanthanoids M = Cr or V x = 0.05 to 0.2 T = 1400 or 1500˚C L* a* b* dE* } barevné koordináty
Aplikace NN pro modelování kvality piva (1) Plzeňský pivovar X ... Chemie + technologie Y ... Subjektivní vlastnosti
Aplikace NN pro modelování kvality piva (2) Predikční schopnost modelu X -> Y X ... Chemie + technologie Y ... Subjektivní vlastnosti
Aplikace NN pro modelování kvality piva (3) Predikční schopnost modelu Y -> X X ... Chemie + technologie Y ... Subjektivní vlastnosti
NN pro modelování a předpovědi časových řad JE Du, JE Te Chemické a fyzikální parametry v primárním a sekundárním okruhu jaderné elektrárny Dukovany. Model NN-TS zde predikoval podstatně lépe než klasické modely časové řady AR, resp. ARIMA. Včasná předpověd budoucích výchylek a nestabilit. Model NN-TS jako inteligentní regulační diagram.