1 / 28

İstatistik eİKT-203

İstatistik eİKT-203. Hafta 02: Verinin Görsel Analizi ( Yrd.Doç.Dr . Levent AKSOY). Konular.  Verinin görsel özetlenmesi ve histogram .  Ortalama , standart sapma ve diğer tanımlayıcı istatistikler. Kombinasyon, Permutasyon ve Olasılık. Olasılık kuramı.

galia
Download Presentation

İstatistik eİKT-203

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. İstatistikeİKT-203 Hafta 02: Verinin Görsel Analizi (Yrd.Doç.Dr. Levent AKSOY)

  2. Konular Verinin görsel özetlenmesi ve histogram. Ortalama, standart sapma ve diğer tanımlayıcı istatistikler. Kombinasyon, Permutasyon ve Olasılık. Olasılık kuramı. Kesikli rassaldeğişkenler. Sürekli rassal değişkenler. Normal dağılım. Örneklem dağılımı eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  3. Frekans Dağılım Tablosu Okula geç gelme sebepleri Sebep Mazeret Sayısı Yüzdesi Trafik sıkışıklığı 4515 Ailevi sebepler 3913 Otobüsün gecikmesi 57 19 Uyuya kalma 11137 Hava durumu3311 Acil durum 15 5 Toplam: 300 100 (Kategorik değişkenler) eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  4. Frekans Dağılım Grafiği Okula Geç Gelme Sebepleri eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  5. Pasta Grafik eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  6. Çapraz Çizelge İki kategorik ve sıralı (ordinal) değişkenin bütün kombinasyonlarını sıralayan tanlolara Çapraz Çizelgeadı verilir. Eğer birinci değişken için rkategori (satır) ve ikinci değişken için de ckategori (sütun) bulunuyorsa, tabloya r x cboyutlarında çapraz çizelge denir. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  7. Çapraz Çizelge Yatırımcıların tercihlerini gösteren (1.000 TL olarak) 3 x 3lükÇapraz Çizelge Yatırım Aracı 1. Yatırımcı 2. Yatırımcı 3. YatırımcıToplam (Kategori) Hisse Senedi46 55 27128 Tahvil32 44 19 95 Nakit15 20 33 68 Toplam93 119 79291 eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  8. Çok Değişkenli Grafikler Kümelenmiş Çubuk Grafik Yatırım Tercihleri eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  9. Çok Değişkenli Grafikler Yığılmış Sütun Grafik Yatırım Tercihleri eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  10. Çok Değişkenli Grafikler Kümelenmiş Sütun Grafik Yatırım Tercihleri eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  11. Pareto Diyagramı Kategorik veriyi tanımlamak için kullanılır. Kategorileri frekansları azalacak şekilde sıralanmış bir çubuk grafik ve birikimli (kümülatif) frekansları gösteren bir çizgi grafikten oluşur. “önemli azınlık” ile “sıradan çoğunluk” arasındaki farkı göstermek için kullanılır. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  12. Pareto Diyagramı Örnek: 400 Çağrı sebeplerine göre ayrılmıştır: eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  13. Pareto Diyagramı 1. Adım: Hataların kaynağını azalan çağrı sayılarına göre sırala 2. Adım: Her kategorinin toplama göre %’sini hesapla eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  14. Pareto Diyagramı Pareto Diyagramı Örneği eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  15. Zaman Serisi Diyagramı Bir değişkenin zaman içerisindeki değerlerini göstermek içinÇizgi Grafik şeklinde zaman serisi diyagramı kullanılır. Yatay eksen zamanı gösterir. İlgili değişkenler de dikey eksende ölçülür. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  16. Zaman Serisi Diyagramı Yıllara Göre Ziyaretçi Sayısı 1000 Ziyaretçi eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  17. Sayısal Verinin Gösterimi Neden Frekans Dağılımı Kullanılır? Frekans dağılımı veriyi özetlemenin bir yoludur. Dağılım ham veriyi daha kullanışlı bir forma sıkıştırır. Verinin hızlı görsel yorumlanmasını sağlar. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  18. Histogram Her sınıf gruplandırması eşit aralıktadır Her aralığın genişliği şu formülle belirlenir: w = (en büyük gözlem – en küçük gözlem) / istenen aralık sayısı Gözlem sayısına göre en az 5 en çok 15-20 aralık oluşturun. Aralıklar örtüşmez veya boşluk bırakmazlar. Aralık genişliğini istenen uç noktalarına ulaşmak için yuvarlayın. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  19. Histogram Örnek: Kışın 20 günün sıcaklıkları (Fahrenheit cinsinden) ölçülmüş ve aşağıdaki veriler toplanmıştır. 24, 35, 17, 21, 24, 37, 26, 46, 58, 30, 32, 13, 12, 38, 41, 43, 44, 27, 53, 27 eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  20. Histogram Ham veriyi artan şekilde sıralayın:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Aralığı hesaplayın: 58 - 12 = 46 Sınıfların (aralıkların) sayısını belirleyin: 5(genellikle 5 – 15 arası) Aralık genişliğini hesaplayın: 10 (46/5=9,2 ve yuvarlayın) Aralıkların sınırlarını belirleyin:10 – 20 arası (10 dahil 20 değil), 20 – 30 arası, . . . , 60 – 70 arası Gözlemleri sayın ve sınıfların frekanslarını bulun. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  21. Histogram Göreli Aralık Aralık Frekans Yüzde 10 – 20 arası 3 .15 15 20 – 30 arası 6 .30 30 30 – 40 arası 5 .25 25 40 – 50 arası 4 .20 20 50 – 60 arası 2 .10 10 Toplam 20 1.00 100 eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  22. Histogram Aralık Frekans 10 – 20 arası3 20 – 30 arası6 30 – 40 arası5 40 – 50 arası4 50 – 60 arası2 (Çubuklar arası boşluk yok) 0 10 20 30 40 50 60 70 Sıcaklıklar (derece Fahrenheit) eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  23. Histogram Kaç aralık kullanılmalıdır? • Çok (Dar sınıf aralıkları) • Aralarında boş sınıfların olduğu düzensiz görüntü verebilir. • Sınıflar arasındaki frekans dağılımını iyi anlatamaz. • Az (Geniş sınıf aralıkları) • Değişimi çok sıkıştırıp mozaiklenmiş görüntü oluşturabilir. • Önemli değişim şekillerini silebilir. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  24. Histogram Aralıkların uç noktaları nasıl belirlenmelidir? Görsellik ve kullanıcı beğenisine bağlı olması nedeniyle kesin bir cevabı yoktur. Deneme-yanılma yoluyla belirlenir. Amaç "güzel,"«göze hoş gözüken" dağılımlar ortaya çıkartmaktır. Nihayetinde verideki değişimleri gösterebilmelidir. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  25. Dal-Yaprak Diyagramı Bir veri kümesindeki dağılım detaylarını kolayca ortaya seren bir yöntemdir. YÖNTEM:Sıralanmış veri dizisini öncül (dal) ve takip eden (yapraklar) basamaklara ayırmaktır. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  26. Dal-Yaprak Diyagramı Sıralı Veri: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 Onluk basamaklarını DAL olarak kullanın: Dal Yaprak 2 1 3 8 • 21 şu şeklilde • 38 bu şekilde • gösterilir eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  27. Histogram Sıralı Veri: 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 Tamamlanmış Dal-Yaprak diyagramı: eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

  28. Hatalar Yüksekliği ayarlanmamış eşit olmayan veri aralıkları. Düşey ekseni sıkıştırmak ya da çarpıtmak. Sıfır noktasının belirtilmemesi. Verilmek istenenden farklı bir mesajın ortaya çıkması. eİKT 203 – İstatistik Hafta: 02 – Verinin Görsel Analizi

More Related