1 / 32

FUNDAMENTE STATISTICE ale CONTROLULUI CALITATII

FUNDAMENTE STATISTICE ale CONTROLULUI CALITATII. PROF. DR. I S AIC- MANIU ALEXANDRU web www.amaniu.ase.ro e-mail AL.ISAIC-MANIU@CSIE.ASE.RO. STATISTICA -elemente recapitulative. Medi a aritmetică de sondaj (sample average, sample mean-value)

grizelda
Download Presentation

FUNDAMENTE STATISTICE ale CONTROLULUI CALITATII

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. FUNDAMENTE STATISTICEale CONTROLULUI CALITATII PROF. DR. ISAIC- MANIU ALEXANDRUwebwww.amaniu.ase.roe-mail AL.ISAIC-MANIU@CSIE.ASE.RO

  2. STATISTICA -elemente recapitulative • Media aritmetică de sondaj(sample average, sample mean-value) • Raportul dintre suma tuturor valorilor x observate în eşantionul considerat şi numărul total n al acestora: Observaţii • În cazul valorilor observate, aranjate în ordine crescătoare sau descrescătoare: în care: n - numărul total al valorilor observate; ni - frecvenţa absolută corespunzătoare valorii xi; fi - frecvenţa relativă corespunzătoare valorii xi.

  3. Dispersie de sondaj (s2)(Sample variance) • Moment centrat de ordinul doi: • Valoarea numerică a acestui indicator sintetic caracterizează în modul cel mai adecvat împrăştierea repartiţiei statistice • Dispersia de sondaj poate fi folosită ca estimaţie aproximativă a dispersiei din populaţia originară, considerându-se formula corectă:

  4. Dispersie de sondaj (s2)(Sample variance) 1. În cazul valorilor observate, aranjate în ordine crescătoare sau descrescătoare: 2. În cazul valorilor observate, grupate în k clase:

  5. Legea normală (Gauss-Laplace) • Una din ipotezele fundamentale in controlul calitatii fiind normalitatea (apartenenţa la legea Gauss-Laplace) a caracterizării investigate este necesar să discutăm despre această lege statistică. • Modelul Gauss-Laplace uzual, din punct de vedere matematic reprezintă o repartiţie statistică definită de • funcţia de repartitie • unde • Respectiv functia de frecventa

  6. sau funcţia de densitate a repartitiei variabilei aleatoare X • X – mărimea fizică măsurată şi care reprezentată grafic are binecunoscuta formă de „clopot” (aşa-zisul „clopot al lui Gauss”): • Se ştie că o funcţie de densitate trebuie să îndeplinească următoarele cerinţe: • (i) şi • (ii) unde D este domeniul de definiţie al variabilei X, în cazul nostru dreapta reală, R.

  7. Scurt istoric – legea normala (1) • Originea acestui model o găsim în lucrarea „Dialog despre cele două sisteme fundamentale ale lumii” a lui Galileo GALILEI (1564-1642), în care el îşi expune părerile referitoare la măsurarea distanţelor dintre diferite corpuri cereşti: Galilei considera că: • erorile întâmplătoare sunt inevitabile în observaţiile obţinute cu diverse mijloace de măsurare • erorile mici au şanse mai mari de apariţie decât cele mari sau foarte mari • măsurările tind să se distribuie aproximativ egal la stânga şi la dreapta unei valori „de referinţă” • majoritatea valorilor observate tind să se grupeze („să se aciuiască”) în jurul acestei valori de referinţă • erorile aleatoare prezente în procesul măsurării/observării sunt diferite (distincte) de cele ce pot apărea în calculele efectuate de experimentator

  8. ( 2 ) • Repartiţia normală apare de fapt pentru prima oară în 1733 într-o lucrare a lui Abraham de MOIVRE (1667-1754), matematician cunoscut mai curând prin „formula Moivre” referitoare la numerele complexe • Abia odată cu lucrările lui Carl Friedrich GAUSS (1777-1855) şi cele ale lui Pierre Simon, Marquis de LAPLACE (1749-1827) se pun în lumină proprietăţile şi importanţa deosebită a acestei legi statistice ca descriptor – iniţial al comportării erorilor de observaţie (Gauss, 1809 în „Theoria Motus Corpum Caelestium” • Laplace (1810/1811 în „Theorie analitique des Probabilites” din 1812) arată rolul teoretic (şi practic) excepţional jucat de legea normală prin aşa-numita TEOREMĂ LIMITĂ CENTRALĂ

  9. (3) Teorema Limita Centrala • Această teoremă, menţionată azi şi în diverse documente ISO (de exemplu ISO Guide 13434, Anexa G. pp. 74-75) a constituit fundamentul construirii fişelor de control de tip SHEWHART destinate verificării unui proces (vezi SRISO 8258/1999). • Într-o formulare „populară” Teorema Limită Centrală afirmă că: dacă sunt variabile aleatoare continue, identic repartizate cu aceeaşi medie (m) şi aceeaşi dispersie (D2), atunci variabila medie este aproximativ normal repartizată, cu aceeaşi medie (m) dar cu dispersia mai mică şi anume • Acest fapt are loc chiar pentru valori modeste ale lui n .

  10. Teorema Limita Centrala • Teorema Limită Centrală a deschis drumul spre „universalizarea” legii normale • Demograful belgian Adolphe QUETELET (1796-1874) a aplicat repartiţia Gauss-Laplace în cazul măsurărilor antropometrice (1846 „Theorie des Probabilites appliquee aux Science Morale set Politiques”). • F.W. BESSEL (1784-18469 opera în mod uzual în această repartiţie la prelucrarea datelor provenite din măsurătorile astronomice. • J.C. MAXWELL (1831-1879), creatorul teoriei cinetice a gazelor, este probabil primul fizician care a încercat să modeleze mişcare a gazelor folosind statistica. Iată ce scria el: • „Vitezele unor particule care se mişcă în vid sunt repartizate după aceeaşi lege ce guvernează comportarea erorilor în metoda celor mai mici pătrate”

  11. Cateva proprietati ale legii normale ( 1 ) • graficul funcţiei are un singur maximumpentru • si două inflexiuni de abscise • parametrii descriptorişiau semnificaţia mediei şi dispersia teoretice: ; • intervalul conţine aproximativ 99,73% din valorile mărimii X.

  12. Cateva proprietati ale legii normale (2) • Funcţia de repartiţie, definită ca: • Are expresia

  13. Variabila se zice variabila normală standard (sau standardizată) şi are funcţia de densitate respectiv de repartiţie sub adică variabila U are media O şi dispersia 1 Aceste funcţii au fost tabelate iniţial de către Laplace.

  14. Valoarea medie, mediana şi moda (valoarea modală) a unei variabile sunt toate egale cu ; • Momentele centrate de ordin impar sunt toate nule. • Momentele centrate de ordin par au expresia • coeficientul de asimetrie (Skewness) este • coeficientul de exces (Kurtosis) este • Funcţia eroare – erf (x) – are forma: • şi corespunde unei densităţi de medie 0 şi dispersie ½ • Coeficientul lui GEARY are valoarea:

  15. Grafice ale legii normale

  16. Estimarea parametrilor m şi sigmase face de regulă cu indicatorii de eşantionaj • respectiv • Legea normală este stabilă, adică dacă sunt variabile de tipul , atunci este tot o variabilă normală, cu media si dispersia

  17. Repartiţia t (STUDENT) • dacă sunt independente, cu parametrii • variabila • se numeşte variabila STUDENT (sau „t”) şi joacă un rol important în experimentele privind compararea a două medii normale (adică a mediilor a două populaţii caracterizate de legea normală )

  18. Repartiţia t (STUDENT) • Densitatea de tip t are forma: • unde • este binecunoscuta funcţie GAMMA a lui EULER (1707-1783).

  19. Repartiţia t (STUDENT) • Denumirea STUDENT provine de la chimistul şi statisticianul britanic William Sealy GOSSET (1876-1937) care a lucrat la o celebră fabrică de bere din Dublin, în calitate de supervizor al procesului de fabricaţie al acestui produs, apreciat azi pe întreg mapamondul ,Gosset a avut ca „sarcină de serviciu” – printre altele – şi compararea calităţii berii produse de firma respectivă cu cea a concurenţilor acesteia.

  20. Repartiţia t (STUDENT) • Astfel s-au născut primele experimente de comparare a calităţii medii, folosind un instrument statistic. Din cauză că patronii fabricii respective nu permiteau angajaţilor o activitate publicistică sub propriul nume, Gosset şi-a ales pseudonimul STUDENT, cu care şi-a semnat toate lucrările, publicate în principal în celebra revistă”BIOMETRIA”>înfiinţată în 1900 de GALTON şi PEARSON.

  21. Testarea normalităţii • Verificarea faptului că datele experimentale obţinute sunt repartizate după legea Gauss-Laplace se poate face în mai multe moduri, şi anume: • algebric(utilizând indicatorii de eşantionaj cu proprietăţile lor specifice în cazul legii normale); • grafic(folosind aşa-numitele „hârtii” sau reţele de tip probabilist) • analitic(utilizând procedee statistice speciale – aşa numitele „teste de concordanţă”).

  22. Testarea normalităţii • Metoda algebrică este foarte simplă dar este relativ subiectivă • deoarece calculând indicatorii de eşantionaj şi anume: • Media: mediana: coeficientul de asimetrie coeficientul de exces coeficientul lui Geary

  23. Testarea normalităţii (1) • este dificil de dat o marjă a aproximărilor şi care ar caracteriza legea normală. Oricum, dacă „apropierile” respective nu au loc (de ex. este limpede că nu mai are rost să facem apel la metode mai sofisticate pentru a depista normalitatea, deoarece valorile asimetriei şi excesului indică tocmai nenormalitatea datelor.

  24. Testarea normalităţii ( 2) • Metoda grafică sau „metoda RP” (a reţetelor probabiliste) a fost pe larg descrisă în limba română în monografia Wiener-Isaic-Maniu şi Vodă (1983) • Pe scurt, RP normală este o hârtie format A4 Într-un anume mod, pe axa verticală fiind fixate valorile • (estimaţii ale funcţiei de repartiţie) • datele pe care experimentatorul s-i le calculează în cazul său concret, datele fiind ordonate • şi înregistrate pe axa orizontală.

  25. RETELE PROBABILISTE

  26. Testarea normalităţii ( 4 ) • Metodele analitice fac apel la un capitol special al teoriei verificării ipotezelor statistice, şi anume la testele de concordanţă („goodness-of-fit” tests) care realizează verificarea concordanţei repartiţiei emprice (pusă în evidenţă de datele experimentale) cu repartiţia teoretică presupusă că „îmbracă” adecvat, că „se mulează„ cel mai bine pe această repartiţie empirică.

  27. Testarea normalităţii ( 5 ) • Verificarea concordanţei se poate face fie cu teste generale, adică • procedee aplicabile pentru orice model statistic presupus potrivit pentru datele observate, fie teste speciale, destinate unui anume tip de model statistic – de exemplu, cel normal. Aceste teste se numesc chiar teste de normalitate sau verificarea normalităţii. Există evident şi teste pentru verificarea exponeţiabilităţii a weibullităţii *etc • *)de la numele inginerului suedez W.WEIBULL (1900-1979) care în 1939 a propus o repartiţie statistică pentru descrierea fenomenului defectării care azi îi poartă numele (vezi Al. Isaic-Maniu, METODA WEIBULL,Ed.Academiei Romane ,1986 )

  28. Testarea normalităţii( 6 ) • Cele mai cunoscute teste generale sunt testul (HI-PĂTRAT), creatde Karl Pearson încă în 1899 şi aplicabil pentru eşantioane de efectiv mare (de dorit valori măsurate; Pearson este „responsabil” şi de inventarea tremenului goodness-of-fit, în 1895 în lucrarea sa „Contributions to the mathematical theory of evolution. II. Skew variation in hemogeneous material”, în Phil. Trans. Roy. Soc. London, Ser. A, vol. 186, pp. 343-414). • Respectiv testul KOLMOGOROV-SMIRNOV aparţinând matematicienilor ruşi Andrei Nicolaevici Kolmogorov (1903-1987) şi Nikolai Vasilevici Smirnov (1900-1966) în două lucrări şi anume „Sulla determinazione empirica di una legge di distribuzione” (Kolmogorov, în „Giornale dell’Instituto Italiano degli Attanari”, 1933, vol. 4, pp. 83-91) şi • „Sur la distribution de ” (Smirnov, în „Comptes Rendue de l’Academic des sciences de Paris”, 1936, vol. 202, pp. 449-452).

  29. Testarea normalităţii ( 7 ) • Teste speciale de normalitate le putem clasifica în funcţie de efectivul eşantionului pe care se lucrează: • teste pentru eşantioane mici (de regulă, ) – de exemplu testul Shapiro-Wilk (1965) sau testul Filliben (1975); • teste pentru eşantioane moderate (de obicei • – de pildă testul lui D’Agostino (1971); • teste pentru eşantioane mari (eventual ) – de exemplu testul coeficienţilor pearsonieni şi. • Toate aceste procedee au fost prezentate în literatura de specialitate înlimba română, aşa că nu le mai reluăm aici. Mai menţionăm existenţa documentului ISO 5479-1997 „Tests for departure from the normal distributin” – tradus şi în limba română sub titlul „Teste pentru verificarea depărtării de la normalitate” (SRISO 5479).

  30. Testul HI - patrat • Regiunea critică a testuluipentru verificarea ipotezei p1 = p2 = … = pm se construieşte pe baza indicatorului statistic de forma: • care pentru are repartiţia cu n – 1 grade de libertate

  31. Echivalenţii englezeşti ai termenilor specifici ANOVA, DOE cât şi a celor conecşi se află în recentul apărut „Dicţionar de statistică generală”(coordonator Al. Isaic-Maniu, Bucureşti, Editura Economică, 2003

More Related