290 likes | 431 Views
CALITA T EA INFORMATIILOR SI A INDICATORILOR PE TERMEN SCURT - I. Suport de curs Master CSIE al.isaic-maniu www.amaniu.ase.ro. Masurarea caracteristicilor si exprimarea prin indicatori statistici. Există, numeroase tipuri de măsurări, precum : măsurarea satisfacţiei clienţilor
E N D
CALITATEA INFORMATIILOR SI A INDICATORILOR PE TERMEN SCURT- I Suport de curs Master CSIE al.isaic-maniu www.amaniu.ase.ro
Masurarea caracteristicilor si exprimarea prin indicatori statistici • Există, numeroase tipuri de măsurări, precum : • măsurarea satisfacţiei clienţilor • măsurarea sărăciei • măsurarea inflaţiei • masurarea rezultatelor activitatii economice la nivel de agent ,la nivel mezo sau macro • măsurarea degradării mediului • masurarea dezvoltarii durabile • masurarea dezvoltarii umane etc.
Finalizarea masurarii consta , în general, in alocarea unor numere anumitor procese sau caracteristici , cu scopul reprezentării relaţiilor existente între acestea şi anumite proprietăţi specifice • Importantă este relevanţa numărului obţinut în raport cu procesul ,fenomenul sau obiectul investigat • Un singur număr obţinut (deci o singură „măsurare”) nu este interpretabil(ă). Numai dintr-o serie de astfel de numere (adică dintr-o repartiţie) se poate extrage o semnificaţie în sensul determinării „erorii de măsurare”
Există o distincţie clară între metoda de măsurare şi procesul de măsurare • Metoda de măsurare cuprinde: • ( I ) specificarea mijlocului de măsurare • ( ii) secvenţa operaţiilor necesare • (iii) metodologiile utilzate • (IV i)condiţiile în care se obţin datele experimentale
Procesul de măsurare reprezintă realizarea (punerea în aplicare) a metodei, în termenii unui anumit joc de măsurare, echipament, condiţii, operatori şi mod de înregistrare a rezultatelor obţinute • O metodă de măsurare nu devine proces de măsurare până când acest proces nu intră în stare de control statistic, în sensul că măsurările devin „produsul” unui univers statistic identificabil • Aceasta înseamnă că putem aloca o repartiţie statistică bine definită acestor valori care reprezintă măsurandul respectiv • De obicei “speram” ca această repartiţie să fie cea normală, deoarece parametrii acestei legi statistice [(m) şi (2)] sunt chiar media şi respectiv dispersia
Acestea se estimează prin(media aritmetică) şi prin indicatorul dispersie : Unde: xisunt valorile observate ale mărimii X • În cazul legii normale (Gauss - Laplace) valoarea medie poate fi luată eventual ca valoare de referinţă acceptată, constituind un substitut al aşa-numitei „valori adevărate” a măsurandului, care este in cele mai multe cazuri necunoscută
O operaţie (de măsurare, în particular) se află în stare de control statistic, dacă există măsuri cantitative ale repetabilităţii şi reproductibilităţii • Prin repetabilitate se înţelege o măsură a variabilităţii între valorile observate în acelaşi laborator,de catre aceasi institutie / institutii • Prin reproductibilitate, o măsură a variabilităţii între două sau mai multe laboratoare/institutii *Termenul „laborator” este generic (convenţional).
Măsurile cantitative ale calitatii procesului de masurare , sunt abaterile standard asociate ( sr /SR) şi respectiv • aşa-numitele limite de repetabilitate( r) / reproductibilitate( R )- (r / R), definite ca • unde |d| este valoarea absolută a diferenţei dintre două rezultate ale unei masurari obţinute în condiţii de repetabilitate / reproductibilitate
Dintre termenii frecvent utilizati in legatura cu masurarea ,.precum: „acurateţe”, „precizie”, „valoare adevărată”: din vocabularul metrologic românesc, primii doi termeni au cam dispărut • Experti in masurare,i-au înlocuit cu exactitatea (justeţea şi fidelitatea), adoptând varianta franceză „exactitude (justese et fidelité)” a documentului ISO 5725 - 1 / 1994. Evident, varianta englezească utilizează “accuracy“(trueness and precision). • Definiţiile lor de dicţionar (Merriam - Webster, 1994) sunt: • Accuracy (1662): freedom from mistake or error: CORECTNESS, EXACTNESS; conformity to truth or to a standard, or model; degree of conformity of a measure to a standard or a true value. • Precision (1740): degree of refinement which an operation is performed or a measurement stated.
Aşadar: • acurateţea reprezintă neafectarea cu greşeli sau erori; corectitudine, exactitate; conformitate cu adevărul, cu un etalon sau cu un model; gradul de conformitate al unei măsurări cu un etalon sau cu o valoare adevărată, • precizia reprezintă gradul de rafinare cu care este executată o operaţie sau cu care este raportată o măsurare • În esenţă : • acurateţea se referă la apropierea măsurărilor de valoarea adevărată (true value), • precizia se referă la apropierea măsurărilor una de cealaltă: de aici ideea de a folosi abaterea standard a valorilor observate ca o măsură cantitativă a variabilităţii „interne” a datelor
Reamintindu-ne ‚”modelul ţintei” vom constata că acurateţea reclamă precizia, dar precizia nu implică în mod necesar şi acurateţea • În ceea ce priveşte „trueness”, dicţionarul citat ne spune că înseamnă „corected for error”, expresie pe care am traduce-o, corectat (sau „curăţat”) de eroare. Alte surse, indică semnificaţia următoare: • Trueness = veridicitate, autenticitate, fidelitate, loialitate, legitimitate, caracter adevărat
Despre valoarea adevărată (true sau actual value) există mai multe opinii • Statisticienii consideră, în general, că aceasta este un element necunoscut, o valoare intrinsecă, proprie unui anumit parametru al unui model statistic asupra căruia se desfăşoară, de fapt, inferenţa statistică: valoarea adevărată poate fi estimată cu ajutorul unor măsurări repetate asupra aceleiaşi mărimi, „purtătoare” a parametrului respectiv, sau asupra unor entităţi de acelaşi tip, ce încorporează acel „parametru”, pe fiecare entitate desfăşurând o singură măsurare
Noţiunea de parametru este, desigur, largă • Un inginer înţelege prin parametru o anumită caracteristică de calitate a unui obiect - de exemplu presiunea într-un conector manometric: un parametru tehnologic • Un analist macro intelege indicele preturilor bunurilor de consum,dezvoltarea umana ,saracia ,economia neobservata , etc. • La rândul său, acest “parametru tehnologic” este caracterizat de „parametrii săi comportamentali”: valoare centrală, marjă de variabilitate etc.
Se presupune că „puritatea aerului”intr-o localitate urbana - ca să concretizăm comentariul - are o valoare adevărată (deseori considerată cea ideală, pe care am dori să o obţinem mereu), şi tocmai această valoare adevărată („întruchiparea ideală a mărimii măsurandului”) vrem s-o estimăm cât mai bine • Prin aceasta înţelegem o cât mai mică distanţă între valoarea estimatorului obţinut şi valoarea adevărată • Cum, din păcate, valoarea adevărată este necunoscută, ea este substituibilă cu o valoare convenţional adevărată sau cu o valoare de referinţă acceptabilă, tocmai pentru a se putea da o imagine cantitativă a performanţei estimatorului obţinut
În practica statistica, se consideră ,că, dacă s-a obţinut un număr suficient de mare de observaţii (de pildă,n≥200- 300 ) asupra unei anumite caracteristici, în condiţii de stabilitate statistică şi de „nepoluare” cu valori aberante sau de contaminare cu valori dintr-o altă populaţie, atunci pe baza acestui număr mare de date se poate lua valoarea lor medie ca valoare adevărată a parametrului (caracteristicii, măsurandului) investigat
În astfel de condiţii, statisticianul consideră “mărimea analizată” ca fiind reprezentată de o repartiţie statistică complet specificată - de exemplu de legea normală N(100; 4), adică de medie m = 100 şi de dispersie 4 (abaterea standard fiind, deci, 2) • In acest caz, adevărata valoare a mediei este de 100 u.c. (unităţi convenţionale), iar împrăştierea este descrisă de intervalul , adică [94; 106] • Orice măsurări efectuate ulterior asupra unui măsurand caracterizat de legea N(100; 4) vor trebui să furnizeze valori ale mediei, de exemplu în jurul valorii adevărate (100)
În cazul în care medii repetate genereaza valori mai mari decât o diferenţă acceptată, aceasta înseamnă fie că măsurandul nu este definit de legea presupusă, fie că există factori perturbatori sistematici în procesul de măsurare INCERTITUDINEA • Incertitudinea - definită „metaforic” ca un dubiu asupra valabilităţii rezultatului unei măsurări, are şi o definiţie operaţională, dată de VIM (Vocabularul Internaţional Metrologic, ediţia a II-a, 1993, pct. 3.9) sub următoarea formă:
Incertitudinea • „Incertitudinea (de măsurare) este un parametru asociat rezultatului unei măsurării ce caracterizează dispersia valorilor ce în mod rezonabil pot fi atribuite măsurandului” • În literatura de specialitate în limba română el apare cu pregnanţă în anii `80, cand diversi autori incercau să explice diferenţa dintre „eroarea de măsurare” şi incertitudine: dacă valoarea adevărată este necunoscută, atunci evident şi diferenţa dintre aceasta şi rezultatul unei măsurări nu poate fi cunoscută
• „De aceea este preferabil să utilizăm termenul incertitudine de măsurare, ca o plajă probabilă în care se poate găsi eroarea de măsurare • În limbajul curent se vorbeşte, totuşi, despre erori de măsurare, înţelegând uneori prin aceasta eroarea individuală a unei anumite măsurări (efectuate), eroarea probabilă a unei măsurări (neefectuate), eroarea limită sau eroarea tolerată a unei măsurări etc.” • Trebuie să acordăm o atenţie deosebită diferenţierii termenilor „eroare” şi „incertitudine”, aceştia nefiind de fel sinonimi: ei reprezintă concepte distincte, nu trebuie confundaţi şi evident nici utilizaţi unul în locul celuilalt
Incertitudinea globală si calitatea informatiilor obtinute • Din punct de vedere statistic, incertitudinea standard - definită ca incertitudine a rezultatului unei măsurări exprimată printr-o abatere standard - reprezintă practic o estimaţie a variabilităţii interne a şirului de observaţii executate asupra măsurandului respectiv • „O măsurare” - în acest context reprezintă întreg ansamblul de operaţii prin care se obţin datele experimentale (statisticienii utilizează frecvent termenul „măsurare” ca sinonim pentru „valoarea ximăsurată” sau valoarea experimentală respectivă)
Abaterea standard calculată cu formula binecunoscută , unde reprezintă media,nu este un estimator nedeplasat pentru sigma, iar un estimator nedeplasat pentru dispersia .
Pentru construirea unui estimator nedeplasat al abaterii standard va trebui să ne reamintim că repartiţia statisticii s este de tip HI (deci - nu hi - pătrat) cu (n-1) grade de libertate, şi că valoarea sa medie E(s) ar forma: este celebra funcţie Gamma a lui Euler unde Prin urmare, coeficientul de nedeplasare pentru s va fi tocmai inversul coeficientului ce înmulţeşte sigma in formula de mai sus
Totuşi, nici în practica obisnuita nu lucrăm cu estimatorul s modificat ( corectat ) • Atunci când calculăm plaja de variaţie naturală a măsurandului, sau când dorim construirea unor intervale de încredere - fie pentru media sau dispersia - folosim statisticile şi s ca atare, sau ne bazăm pe faptul că statistica are o repartiţie HI - PĂTRAT cu (n - 1) grade de libertate, fapt cunoscut încă din secolul al XIX-lea