1 / 18

Mintavételi hiba, hibaszámítás

Mintavételi hiba, hibaszámítás. Hibatípusok Véletlen hiba: A mérési eredmények a valóságos értéktől mindkét irányban azonos valószínűséggel, véletlenszerűen térnek el. Nagy számú mérés átlagát véve a véletlen hiba tetszőlegesen csökkenthető.

mei
Download Presentation

Mintavételi hiba, hibaszámítás

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Mintavételi hiba, hibaszámítás

  2. Hibatípusok • Véletlen hiba: A mérési eredmények a valóságos értéktől mindkét irányban azonos valószínűséggel, véletlenszerűen térnek el. Nagy számú mérés átlagát véve a véletlen hiba tetszőlegesen csökkenthető. • Rendszeres (szisztematikus) hiba: A mérési eredmények a valóságos értéktől eltérő érték körül ingadoznak. • Sokféle oka lehet, pl: • Nem megfelelő mintavétel, • Hibás vagy rosszul beállított műszer, • Analitikai (módszertani) probléma, • Figyelmen kívül hagyott, a mérést befolyásoló külső tényező (pl. hőmérséklet hatása).

  3. Hibaszámítás elmélete (valószínűségelmélet) Mintavétel, mérés valószínűségi változó valószínűségi sűrűségfüggvény Normális eloszlás: azok a valószínűségi változók, melyek értékét sok kismértékű véletlenszerű hatás befolyásolja. „m” az eloszlás várható értéke, „s” a szórás Gauss-függvény: u = (x-m) / s normalizált Gauss-függvény: A normalizált Gauss-eloszláshoz tartozó valószínűségi eloszlásfüggvény: (hibaintegrál), F()=1. A normalizált Gauss-függvény (hibafüggvény):

  4. Alkalmazás: Milyen valószínűséggel esik a valószínűségi változó értéke a várható érték körüli, adott sugarú intervallumba? x1 = m-Δx és x2 = m+ Δx Transzformálás után: u1 = - Δ x/s és u2 = Δ x/s = v P(u1 u  u2) = F(u2) - F(u1) = f(v) - f(-v) f(-u) = 1 - f(u) P(-vuv) = 2 f(v) - 1 Szimmetria miatt: Annak a valószínűsége, hogy a változó értéke kiessen az adott szimmetrikus intervallumból, tehát egy adott tűrésnél jobban eltérjen a várható értéktől: P(u  -v u  v) = 1- (2f(v)-1) = 2(1-f(v)).

  5. A középérték eloszlásának tulajdonságai

  6. A hiba meghatározása a matematikai statisztika módszereivel A centrális határeloszlás tétele szerint bármilyen eloszlású sokaság esetén az n elemű minta számtani középértékének eloszlása a minta elemszámának növekedésével egy olyan normális eloszláshoz tart, melynek várható értéke megegyezik az eredeti eloszlás várható értékével. Ez azt jelenti, hogy ha már egyetlen mérési eredmény is átlagnak, pl. időátlagnak tekinthető, akkor várható, hogy az Gauss-eloszlású lesz. A mérési eredmények viszont nagyon gyakran ilyen átlagértékek. A gyakorlatban legtöbbször normális eloszlású mérési eredményekkel találkozunk.

  7. A vízhozamok általában erősen, a vízminőségi változók komponenstől függően különböző mértékben mutatnak pozitív ferdülést, leggyakrabban lognormál eloszlásúak. Tesztelés: Monte Carlo szimulációval Példa: adatsorok ritkítása → becslés hibájának eloszlása: A Zala és a Tetves-patak éves átlagos összes P terhelésének becslésében elkövetett relatív hiba Monte Carlo szimulációból nyert empirikus eloszlása (N=365, n=12)

  8. Variancia és szórás meghatározása Torzítatlan becslés varianciáját becsülhetjük az egyes mérések hibanégyzetének átlagával : Torzított becslésnél a variancia n-szeresének becsült értéke a valóságos variancia (n-1)-szerese A mérési eredmények korrigált tapasztalati szórása és a középérték tapasztalati szórása („standard deviation”):

  9. Konfidencia intervallum, megbízhatósági szint megadása • Gauss-eloszlás→ • a mérési eredmények a várható érték körüli s sugarú intervallumba 68,3%, • a 2 s sugarú intervallumba 95,4 % valószínűséggel esnek. • Adott P valószínűség (Pkonfidencia szint) : [m - k s , m + k s ] • Konfidencia intervallum, melybe a mérési eredmények az adott P valószínűséggel beleesnek. • P = 68,3% k = 1 • P = 95,4% k = 2 • P = 95% k = 1.96 u = S = 1 f(u) = 0.84134 P (-1 ≤ x ≤ 1) = f (1) – (1 – f(1))= 2 f(1) -1 = 0.683

  10. A t paraméter meghatározása (Student-féle t-eloszlás) Mérési eredményeknél: a szórást sem ismerjük, csak becsüljük a középérték korrigált tapasztalati szórásával. Szórás is pontatlan→ ugyanahhoz a valószínűséghez nagyobb számmal kell megszorozni a becsült szórást a konfidencia intervallum meghatározásánál, mint ezt egy ismert szórású Gauss-eloszlásnál tennénk. A Student-féle t paraméter értékei P konfidenciaszintnél és N mérésszámnál X (mért mennyiség) = =  t

  11. tapasztalati szórás - S N n = N α t X Nn N S 1 átlag = N α t n X N Összefoglalva: N - elemű adatsor n - statisztikai minta α- „N” elemű idősor középérték relatív hibája, ha azt „n” mérésből becsüljük (Normál eloszlástfeltételezve): (Cochran, 1962) ∞ N → 95 %-os konfidencia szinten t=1.96 Relatív hiba: α = f (mintaszám, relatív szórás)

  12. MINTASZÁM CSÖKKENTÉSÉNEK HATÁSA minta / év Mintaszámtól (n) függő tényező: Heti / napi: 2.7 Kétheti / napi: 3.8 Havi / napi: 5.5 Szezonális / napi: 9.6 Havi / kétheti: 1.5 Szezonális / kétheti: 2.5

  13. MINTAVÉTELI HIBA Adott tartósságú érték meghatározásának hibája Relatív hiba: 90%-os tartósságú koncentráció becslési hibája a középérték hibájának háromszorosa!

  14. Vízminőség paraméterek változékonysága Függ: vízhozam, szezonális hatások (biológia), szennyezések

  15. Vízminőségi jellemzők relatív szórása Víztípusok

  16. Mintavétel hibája a szórás függvényében Víztípusok

  17. Heti Kétheti Szezonális Kívánt pontosság eléréséhez szükséges éves mintaszám

  18. Kívánt pontosság eléréséhez szükséges éves mintaszám

More Related