710 likes | 1.59k Views
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı. BİYOİSTATİSTİK. Veri Tipleri ve Sayısal Özetleme. Prof. Dr. Mehmet N. ORMAN. Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr. Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı.
E N D
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı BİYOİSTATİSTİK Veri Tipleri ve Sayısal Özetleme Prof. Dr. Mehmet N. ORMAN Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı • Üretim Süreci: Girdi İşlem Ürün (Sonuç) • Araştırma Süreci: Hangi alanda olursa olsun araştırma bir BİLGİ’ye ulaşma sürecidir. Veri Analiz Bilgi El ile ya da birtakım bilgisayar programları yardımıyla istatistiksel yöntemler kullanılır.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı • Biyoistatistik, insan ve toplum sağlığı için, bilgi edinme amacıyla • Verilerin toplanması, • Analiz edilmesi, ve • Yorumlanmasına yönelik istatistiksel yöntemler topluluğudur.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Tıbbi Araştırmalarda Biyoistatistik İşlevleri • Alanla ilgili yayınlarda, uluslar arası ortak bir dil sağlar ve objektif bir araç olarak kullanılır. • Alanla ilgili yayınlarda, verilen bilgilerin geçerliliği ve güvenirliği değerlendirilebilmesi, bu hekimin bilgilenmesinde süreklilik sağlar. • Hekimin araştırma projelerine katılımı (plan → bitim), araştırma sonuçlarının hasta tedavisi ve toplum sağlığına yönelik olarak pratiğe geçirilebilmesi. Tüm bunlar, belirli düzeyde hatta bazı durumlarda ileri düzeyde biyoistatistik bilgisi gerektirmektedir.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı BİYOİSTATİSTİK • Çıkarsamaya (inference) yönelik yöntemler • Tahminleme • Hipotez testi • Olasılık teorisi yardımı ile • Tanımlayıcı yöntemler • (Descriptive) • Tablo • Grafik • Sayısal yöntemler (Tanımlayıcı Örnek İstatistikleri)
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Veri Tipleri ve Tanımsal Veri Analizi • Değişken: Araştırma konusuna göre deneysel üniteler (birey, rat, film) üzerinde ölçülmesi (incelenmesi) gereken özelliklerin her biridir. Örnek: Belirli bir hasta grubunda gerçekleştirilen klinik bir araştırmada • İlaç(A-B-Kontrol), cinsiyet, hipotansiyon(var/yok), bulantı-kusma(var/yok) • Tedavi memnuniyeti • Yaş, boy, ağırlık, OKB, KAH gibi ölçülen özelliklerin her biri birer değişkendir.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Ölçüm Skalaları Değişkenlerin ne şekilde (tablo-grafik-sayısal) özetleneceği ve hangi yöntemler kullanılarak analiz edilebileceği, hangi ölçüm SKALASINDA elde edildiği ile yakından ilişkilidir.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sınıflayıcı (Nominal) Skala • Deneysel üniteler üzerinde ölçülen değerlerin sadece kategorileri/sınıfları gösterdiği değişkenler bu skalada elde edilir. • Farklı iki değer arasında sadece =/≠ ayrımı yapılabilir. Örnek: İlaç-tipi, cinsiyet, kusma-bulantı, hipotansiyon • Eğer ölçülen değişken sadece iki farklı değer alabiliyor ise bunlara Dikatom ya da Binary değişkenler de denir. (cinsiyet, hipotansiyon, bulantı-kusma) Bu ölçüm skalasında elde edilen gözlemler kalitatif ya da kategorik gözlemler olarak da adlandırılmaktadır.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sıralayıcı (Ordinal) Skala • Ölçülen değerlerin kategorileri göstermesinin yanında, farklı kategoriler arasında büyüklük küçüklük gibi bir bilginin bulunduğu değişkenler bu skalada elde edilir. • =/≠ yanında farklı iki değer arasında </> ilişkisi bulunmaktadır. Örnek: tedavi memnuniyeti, VKİ’ye göre beden yapısı (zayıf, normal, hafif şişman, şişman) • Verilerin nasıl kodlandığı önemlidir; sınıflar arasında, incelenen özellik bakımından, artan ve azalan yapıyı korumak gerekir.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Skala • Ölçülen değerlerin sayılarak ya da bir metrik sistemde elde edildiği değişkenler bu skalada elde edilirler. • =/≠, </> yanında farklı iki değer arasındaki uzaklıklar anlam taşımaktadır. • Bu skalada elde edilen gözlemlere, kantitatif gözlemler de denir. Sürekli ve Kesikli olmak üzere iki tipi vardır. Gözlemler sadece tam sayısal değerler alabiliyor ise (gebelik sayısı, diş sayısı gibi) kesikli, iki tam sayı arasında her türlü değeri alabiliyor ise (yaş-boy gibi) sürekli skalada elde edilmiş olurlar.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler • Tek bir değişken için • Frekans tablosu-Örnek1 • Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için • Kros (contingency) tablosu-Örnek4 • Çubuk grafikleri-Örnek5
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı ÖRNEK-1(Sınıflayıcı) Tablo 1. Kullanılan ilaçlara göre dağılım
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı ÖRNEK-1(Sınıflayıcı) Tablo 2. VKI’ye göre hastaların beden yapısı dağılımı
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler • Tek bir değişken için • Frekans tablosu-Örnek1 • Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için • Kros (contingency) tablosu-Örnek4 • Çubuk grafikleri-Örnek5
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı ÖRNEK-2 Şekil 1. VKİ’ye göre vücut yapısı dağılımı
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler • Tek bir değişken için • Frekans tablosu-Örnek1 • Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için • Kros (contingency) tablosu-Örnek4 • Çubuk grafikleri-Örnek5
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı ÖRNEK-3 Şekil 2. VKİ’ye göre vücut yapısı dağılımı
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler • Tek bir değişken için • Frekans tablosu-Örnek1 • Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için • Kros (contingency) tablosu-Örnek4 • Çubuk grafikleri-Örnek5
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Örnek-4 (SPSS Tablosu)
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler • Tek bir değişken için • Frekans tablosu-Örnek1 • Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için • Kros (contingency) tablosu-Örnek4 • Çubuk grafikleri-Örnek5
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı ÖRNEK-5 Şekil 3. Cinsiyete göre beden yapısı dağılımı
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sınıflayıcı ve Sıralayıcı Veriler İçin Tablo ve Grafikler • Tek bir değişken için • Frekans tablosu-Örnek1 • Pasta (pie)-Örnek2 ve çubuk (bar) grafikleri-Örnek3 • İki değişken için • Kros (contingency) tablosu-Örnek4 • Çubuk grafikleri-Örnek5
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı ÖRNEK-6 Tablo 4. Hastaların yaşlara göre dağılımı
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Örnek-6 (SPSS tablosu)
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
ÖRNEK-8 (Hastaların yaş dağılımı) Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Yaş (yıl)
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı ÖRNEK-9 (Hastaların yaş dağılımı) Yaş (yıl)
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı ÖRNEK-10Box grafiği
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Örnek-11 (cinsiyete göre yaş dağılımı) Yüzde (%) Yaş (yıl)
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Örnek-12 (ilaç gruplarına göre VKİ dağılımı)
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Nümerik Veriler için Tablo ve Grafikler • Tek bir değişken için • Frekans Tablosu: değişkenin çok sayıda farklı değer aldığı durumlarda, veriler sınıflandırılmak zorundadır.Örnek6 • Gövde ve Yaprak Tablosu. Örnek7 • Histogram (frekans tablosundaki bilgiler kullanılır) Örnek8, frekans poligonu Örnek9, box grafiği Örnek10 • İki değişken için • Frekans tablosu, gövde ve yaprak tablosu • Frekans poligonu Örnek11, box grafiği Örnek12, nokta (dot) grafiği Örnek13, serpme(scatter) grafiği Örnek14.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sayısal Özetleme • Bu bölümde, bir veri setinin bazı sayısal değerler kullanarak özetlenmesine yarayan Tanımlayıcı Örnek İstatistikleri incelenecektir. • Yer Ölçüleri • Aritmetik ortalama : • Geometrik ortalama : • Harmonik ortalama :
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı ÖrnekTablo 1 GO = antilog (10.921/15) = 5.35 HO = 15/3.098 = 4.84
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sayısal Özetleme-II • Ortanca (Medyan): • Sıralanmış verilerin ortasında yer alan değerdir. • Denek sayısı tek ise (n+1)/2’ inci • Denek sayısı çift ise (n/2) ve (n+2)/2’inci değerlerin ortalaması • Hangi durumda ortanca tercih edilmelidir? • Tepe Değeri (mod): • Bir veri setinde en çok tekrar eden değer(ler) • Tepe değeri olmayan durumlar olabilir.
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Örnek Tablo 1’deki sıralanmış veriler Ortanca: n =15 (tek) (n+1)/2 = 8. gözlem değeri 5 ortanca olur. M = 5 Tepe Değeri: Bu veri setinde 5 değeri en çok tekrar eden (5 kez tekrar etmiştir) değerdir. TD = 5
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Merkez belirten ölçüler arasındaki ilişki
Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı Sayısal Özetleme - III • Ortalama, ortanca ve tepe değeri Merkez belirten yer ölçüleridir. • Bunların dışında kullanılan Konum belirten yer ölçüleri vardır: • Kartil (%25)(Q1,Q2,Q3) • Desil (%10) • Persentil (%1)