450 likes | 1.26k Views
Sosyal Bilimlerde Araştırma Yöntemleri. Ölçme. Plan. Ölçme türleri Ölçme düzeyleri Ölçüm kalitesi Güvenlirlik Geçerlik Bileşik ölçüm türleri Endeksler Ölçekler Tipolojiler. Ölçme. Kavramsallaştırma İşletimselleştirme Ölçme. Ölçme.
E N D
Plan • Ölçme türleri • Ölçme düzeyleri • Ölçüm kalitesi • Güvenlirlik • Geçerlik • Bileşik ölçüm türleri • Endeksler • Ölçekler • Tipolojiler
Ölçme • Kavramsallaştırma İşletimselleştirme Ölçme
Ölçme • Nesneleri ve olayları bir değişkeni oluşturan özellikler aracılığıyla tanımlamak için gerçek dünyanın dikkatle ve istendik bir biçimde / kasıtlı olarak gözlenmesi
Kavramların Ölçümü • Sosyal bilimciler demokrasi, madde bağımlılığı, yabancılaşma, yoksulluk, aşk, nefret, önyargı, köktendincilik gibi kavramları ve var olan her şeyi ölçebilir mi? • Kişinin sevgilisini günde kaç kez telefonla aradığını ölçebiliriz. Ama “aşk”ı ölçebilir miyiz?
Ölçme Türleri • Doğrudan gözlenebilenler (gözlem ya da görüşme yoluyla) • Dolaylı olarak gözlenebilenler (anket soruları yoluyla) • “Yapı”lar aracılığıyla gözlenebilenler (doğrudan/dolaylı olarak gözlenemeyen, ancak gözlemlere dayanan kuramsal yapı/yaratı, örneğin IQ testleri)
Ölçme Düzeyleri I • Özellik: Bir şeyin özelliği, niteliği (kadın, yaşlı, vs.) • Değişken: Özelliklerin mantıksal seti (cinsiyet değişkeni için mantıksal set –çoğu araştırmalarda- Erkek ve Kadın’dan oluşur) • Kavramsallaştırma ve İşletimselleştirme süreçleri değişkenlerin ve bu değişkenleri oluşturan değerlerin belirlenmesidir • Değişkenlerin değerleri tam olmalı ve her gözlem bir değer altında sınıflanmalıdır
Ölçme Düzeyleri II En az kesin / En düşük • Sınıflandırma • Cinsiyet, doğum yeri, saç rengi, vs. • Sıralama • Mantıksal olarak sıralanabilen değerler (azdan-çoğa, sertten yumuşağa, uzundan kısaya vs., manga) • Eşit aralıklı • Değerleri ayıran mesafe birbirine eşit ve anlamlı • Sıfır yokluk anlamına gelmiyor (IQ, sıcaklık) • 20 derece 10 dereceden iki kat sıcak değil • Oransal • Sıfır değerinin anlamı var • Yaş, üye sayısı, kütüphaneye gitme sıklığı vs. • Ayda 1000TL geliri olan 2000TL geliri olanın yarısı kadar kazanıyor En kesin / en yüksek
Ölçme Düzeyleri - Özet Kaynak: http://edf5481-01.fa02.fsu.edu/Guide2.html
Değişkenleri Ölçme Düzeyleri Niçin Önemli? I • Yaş (oranlı) • Ortalaması, standart sapması alınabilir • Cinsiyet (sınıflama) • Erkek-kadın yüzdesi verilebilir; ort./SS olmaz) • Dindarlık (sıralama) • Likert ölçeği (dağılım verilebilir)
Değişkenleri Ölçme Düzeyleri Niçin Önemli? II • Ölçümler en ayrıntılı düzeyde yapılmalı • Oranlı ölçüm sıralama ya da sınıflama düzeyine çevrilerek rapor edilebilir • Örneğin yaş bilgisi genç, orta yaşlı, yaşlı diye sıralama düzeyinde ya da 1970 öncesi/sonrası doğanlar diye sınıflama düzeyinde verilebilir • Tersi doğru değil • Ama verileri genç, orta yaşlı, yaşlı şeklinde topladıysanız bunu oranlı düzeye çeviremezsiniz • Ölçme düzeyleri daha sonra uygulanacak istatistik testleri belirler
Ölçüm Kalitesi: Güvenilirlik • Güvenilirlik tutarlılığın bir fonksiyonudur • Güvenilirlik • Farklı ölçümlerin tutarlı bir biçimde aynı sonucu vermesi • Güvenilirlik doğruluk anlamına gelmez (ölçümler tutarlı olsa da yanlış olabilir) • Güvenilir ölçümler yapma yöntemleri • Test – yeniden test • Yarıya bölme yöntemi • Bilinen ölçüleri kullanma • Araştırmacıların güvenilirliği Kaynak: Babbie, 2007, s. 145-146
Ölçüm Kalitesi: Geçerlik • Ölçüm geçerliği: Kavramsal ve işletimsel tanımların birbirine uygun olması • Ölçümün araştırılan kavramın gerçek anlamını yansıtması • Ör., zeka ölçümü için IQ testi kütüphanede geçirilen süreden daha geçerli sonuçlar verir)
Ölçüm Geçerliği Türleri Kaynak: Babbie, 2007, s. 146-147 • Yüz geçerliği (facevalidity) • Bir ölçümün görünüşte bir kavramı ölçüp ölçmediği (ör., dindarlıkla camiye gitme sıklığı) • Ölçüt geçerliği • Kestirim geçerliği (ör., sürüş testi sonuçları yüksek olanların daha az trafik cezası almaları beklenir) • Yapı geçerliği • Değişkenler arasındaki mantıksal ilişkilere dayanır (ör., evlilikte mutluluk ölçüsü bağlılıkla ne kadar ilgili? Mutlu olanlar daha mı az aldatıyorlar?) • Kapsam geçerliği • Bir ölçümün bir kavramın farklı anlamlarını kapsaması (ör., bir IQ testi sadece aritmetik sorularından oluşuyorsa kapsam geçerliği düşüktür
Ölçüm Güvenilirliği / Geçerliği Testlerinin Özeti Geçerlik (doğru ölçüm) Yüz geçerliği –başkalarının yargısına göre Kapsam–tüm anlamları içermesi Ölçüt–dışsal bir kaynakla uyuşur • Uyuşan (concurrent): Mevcut bir ölçüyle uyuşur • Kestirimsel: Gelecekteki davranışla uyuşur Yapı–birden çok gösterge birbiriyle tutarlı • Yakınsak: Benzer olanlar benzerdir • Ayrışan: Farklı olanlar farklıdır Kaynak: Neuman, 2006, s. 193 Güvenilirlik (güvenilebilir ölçüm) Kararlılık–zaman içinde (test-yeniden test yöntemi kullanarak doğrula) Temsil–alt gruplar arasında (yarıya bölme yöntemi kullanarak doğrula) Eşdeğerlik–göstergeler arasında (alt evren analizi kullanarak doğrula)
Geçerlik - Güvenilirlik Geçerli ve güvenilir Güvenilir Ama geçerli değil Geçerli ama güvenilir değil Kaynak: Babbie, 2007, s. 148’den uyarlandı
Sorular Sorarak Kavramları Ölçme • Soru sorma teknikleri (anket, görüşme, deney, alan araştırması vd.) • Açık uçlu – kapalı uçlu sorular • Seçenekler açık ve anlaşılır olmalı • “Diğer” seçeneği olmalı • Çift önermeli soru sorulmamalı • Yanıtlayanlar işin ehli olmalı • Yanıtlayanlar soruları yanıtlamak istemeli • Sorular ilgili olmalı • Sorular kısa olmalı • Negatif soru sorulmamalı • Önyargılı soru ve sözcüklerden kaçınılmalı
Kavramları Nasıl Ölçeriz? Yaş, cinsiyet gibi bazı kavramları “ölçmek” nispeten kolay. Basit ölçümler yeterli (“Yaşınız? . . .” veya “Cinsiyet: E ___ K ___” gibi Ama sosyal bilim kavramları genellikle karmaşık Bir kavram değişik anlamlara gelebiliyor Örneğin “yabancılaşma” kavramının çeşitli boyutlarını ölçmek için genellikle birden fazla gözlem yapmak, “bileşik ölçek” geliştirmek gerekli
Yabancılaşma Kavramının Ölçümü Yabancılaşma Çok Az Kaynak: Babbie, 2007, s.131; Srole, 1956, s. 712-713 • LeoSrole (1956) yabancılaşma kavramını ölçmek için 5 sorudan oluşan bir bileşik ölçüm geliştirdi: • Bazıları aksini söylese de ortalama insanın durumu kötüye gidiyor • Gidişata bakılırsa doğurmak adil değil • Bugünlerde insan gününü yaşamalı, yarının ne olacağı belirsiz • Bugünlerde insan kime güvenebileceğini gerçekten bilmez • Kamu yöneticilerine yazmanın pek yararı yok, çünkü onlar gerçekte ortalama insanın sorunlarıyla ilgili değiller
Bileşik Ölçümler • Bileşik ölçümler nicel araştırmalarda kullanılır • Bir kavramla ilgili farklı göstergeler birleştirilerek tek ölçüm haline getirilir (ör., IQ testi) • Bir kişinin zeka düzeyi hakkında tek bir soru kaba bir fikir verebilir • Ama birden fazla soru daha kapsamlı ve doğru bilgi verir
Bileşik Ölçüm Türleri Endeksler Ölçekler Tipolojiler
Endeksler • Sık kullanılan bir nicel ölçüm • Sıralama ölçümü • Bir kavramın farklı göstergelerini ölçmek için birden fazla “gözlem” yapılır • “Kadınlar erkeklerden farklıdırlar • Kadınlara oy verdirilmemelidir • Kadınlar erkeklerden güçsüzdürler • Kadınlar duygusal oldukları için üst düzey yönetici olmamalıdırlar • vs. vs.” • Her gözlem eşit ağırlıklıdır • Skorların toplamı endeksi oluşturur • Ör., TÜFE , ÜFE, BM İnsani Gelişme Endeksi, vd.
Fiyat Endeksi • Fiyat endeksi, seçilmiş mal ve hizmetlerin ortalama fiyatlarının belli bir döneme göre değişimini ölçer • “Hayat Pahalılığı İndeksi” - 1914 (İstanbul’da 26 maddenin perakende fiyatlarına göre hazırlanmış) • Toptan Eşya Fiyatları Endeksi (TEFE) – 1929- İTO (şimdiki Üretici Fiyatları Endeksi -ÜFE) • “Belirli bir referans döneminde ülke ekonomisinde üretimi yapılan ve yurtiçine satışa konu olan ürünlerin,üretici fiyatlarını zaman içinde karşılaştırarak fiyat değişikliklerini ölçen fiyat endeksidir.” • Tüketici Fiyatları Endeksi (TÜFE): • “Tipik bir tüketicinin satın aldığı belirli bir ürün ve hizmet grubunun fiyatlarındaki ortalama değişimleri gösteren bir ölçüttür” Kaynak: www.tuik.gov.tr; tr.wikipedia.org
TÜFE Kaynak: www.tuik.gov.tr; TÜİK, 2008, s. 56 TÜFE Türkiye, 26 bölge ve 81 il için hesaplanmaktadır TÜFE sepetinde 851 ürün var (ürün listesi için bkz. www.tuik.gov.tr)
ÜFE Kaynak: www.tuik.gov.tr; TÜİK, 2008, s. 56 ÜFE hesaplaması için 5 sektörde 1776 firmanın ürettiği maddelerin fiyatları kullanılıyor.
TÜFE Yıllık Değişim Oranları Kaynak: www.tuik.gov.tr
Örnek: Siyaseten Aktif Olma • Endeksi oluşturan sorular eşit ağırlıklıdır • “Kamu görevlilerine mektup yazarım • Siyasi dilekçelere imza atarım • Siyasi bir amaç için para yardımı yaparım • Oy veririm” • Üç seçeneği işaretleyenler iki ya da bir seçeneği işaretleyenlere göre siyaseten daha aktiftirler
Örnek: İşle İlgili Depresyon Size uygun olan seçenekleri işaretleyiniz. _Havamda değilim _Hiç nedensiz yoruluyorum _Kendimi rahatsız hissediyorum _Normalden daha çabuk sinirleniyorum” Skorlar toplanır 4: Sık 3: Bazen 2. Nadiren 1: Asla Hepsini işaretleyen biri ikisini işaretleyenden daha depresiftirdenebilir
Örnek: “İyi Meslek” “Aşağıdakilerden hangisi daha iyi bir meslektir?” • Maaşı iyi ____ __ __ __ __ • İş güvenliği var __ __ __ __ __ __ • İlginç ve meydan okuyucu __ __ __ __ __ __ • İş koşulları (iş saatleri, vs.) __ __ __ __ __ __ • Yükselme olanağı var __ __ __ __ __ __ • Prestijli__ __ __ __ __ __ • Karar verme özgürlüğü var __ __ __ __ __ __ Şoförlük E H Sekreterlik EH Muhasebecilik EH Kaynak: Neuman, 2006, s. 192
Endeks Oluşturma • Soru seçimi • Yüz geçerliliği • Tek boyutluluk • Genellik/spesifiklik • Varyans • Sorular arasındaki ampirik ilişkiler • Sorular birbiriyle ilgili olmalı • Eşit ağırlıklı olmalı • Varyans (herkesin evet ya da hayır dediği seçenekler indeks oluşturmak için iyi sorular değil) • İki soru arasında çok güçlü bir ilişki varsa biri çıkarılmalı (iki soru da aynı boyutu ölçüyor demektir) • Göstergeler bir değişkenin sebebi mi yoksa sonucu mu diye bakılmalı • Sebebiyse aralarında ilişki olması bir şey ifade etmez (örneğin, siyah ya da kadın olmak ayrımcılığı artıran bir husus; ama ırk ile cinsiyet arasında ilişki var diyemeyiz • Soruların geçerliliğinin sınanması Kaynak: Babbie, 2007, s. 156-157
Endeks Geçerleme • İyi endeksler bir değişkenle ilgili ölçümleri sıralamaya yardımcı olur (az liberal – çok liberal vs.) • Soru analizi (içsel geçerleme) • Dış geçerleme (mevcut endeksle değişkenin diğer göstergeleri arasındaki ilişki)
Ölçekler • Nicel ölçüm • Sıralama ölçümü • Bir kavramın farklı göstergelerini ölçmek için birden fazla “gözlem” yapılır • Her gözlem farklı ağırlıklıdır • Ölçekler göstergeler arasında yapı oluşturarak daha emin bir sıralama yapmayı sağlar
Örnek: Siyaseten Aktif Olma • “Oy veririm • Siyasi kampanyalara para veririm • Siyasi kampanyalarda çalışırım • Seçimlerde aday olurum” • Ölçeği oluşturan sorular farklı ağırlıklıdır • Seçimlerde aday olmak oy vermekten daha ağırlıklı bir aktif olmayı temsil ediyor • Seçimlerde aday olurum seçeneğini işaretleyenlerin diğer seçenekleri de olumlu yanıtlamaları beklenir
Örnek: Kadınların Kürtaj Hakkı “__Bir kadın tecavüz sonucu hamile kaldıysa kürtaj hakkı olmalıdır __Hamilelik kadının hayatını tehlikeye sokuyorsa kürtaj hakkı olmalıdır __Evlilik dışı hamile kalan bir kadının kürtaj hakkı olmalıdır” • Son şıkkı işaretleyen kişi diğer şıklara da muhtemelen “evet” der
Likert Ölçeği • En yaygın kullanılan ölçeklerden biridir • Standart yanıt kategorileri (Tamamen Katılıyorum, Katılıyorum vs.) kullanılır • Yaygın olarak beşli yanıt seçeneği sunulur • Verilen yanıtların ortalaması alınır • TK K 0 -K --K • Kadınlar erkeklerden farklıdırlar x • Kadınlara oy verdirilmemelidir x • Kadınlar erkeklerden güçsüzdürler x • Kadınlar duygusal oldukları için üst • düzey yönetici olmamalıdırlar x • Kadınlar erkekler kadar iyi araba • süremezler x • . . .
Bogardus Sosyal Uzaklık Ölçeği • İnsanların toplumsal ilişkilere katılıma istekli olup olmadıklarını ölçer • Tek boyutlu, homojen, Evet/Hayır şeklinde yanıtlanabilen bir dizi sorudan / önermeden oluşur. Ör., “Türkler azınlıklara karşı önyargılı mıdır?” __ Azınlıklarla aynı ülkede yaşamak isterim __ Azınlıklarla aynı kentte yaşamak isterim __ Azınlıklarla aynı mahallede yaşamak isterim __ Azınlıklarla aynı evde yaşamak isterim __Çocuğumun bir azınlık mensubuyla evlenmesine razı olurum Kaynak: Babbie, 2007, s. 168-169.
Thurstone Ölçeği • Bir tür bileşik ölçümdür • Bir değişkeni tanımlayan göstergeler gruplanır ve hakemlerce ağırlıklandırılır • Örneğin, azınlıklara karşı önyargıyı ölçmek için hazırlanan 100 ifadeden hangilerinin en iyi ölçtüğü hakemlere sorularak belirlenir • Pek ekonomik değil Kaynak: Babbie, 2007, s. 170.
Guttman Ölçeği Guttman Ölçeği Kaynak: Babbie, 2007, s. 173 .
Anlamsal Fark Ölçeği • Denekler iki zıt sıfattan hangisini hangi düzeyde benimsediklerini seçerler • İşaretin iki ucun neresine konduğu önemlidir Sosyal Bilimlerde Araştırma Yöntemleri dersi: Çok Biraz Nötr Biraz Çok İlginç ___________________________ Sıkıcı Basit ___________________________ Zor Yararlı __________________________ Yararsız
Tipolojiler • Sınıflama bileşik ölçümü • Tipolojiler bağımsız değişken olarak kullanılabilir ama tipolojileri bağımlı değişken olarak analiz etmek ve yorumlamak zor • Gazetelerin politik eğilimleri Kaynak: Babbie, 2007, s. 175.
Özet • Tek gösterge nadiren bir kavramın tüm boyutlarını ölçmeye yeterli • Endeksler ve ölçekler sıralı ölçümlerdi • Endekslerde göstergeler toplanır • Ölçeklerde değişkenin göstergeleri arasındaki mantıksal ya da ampirik yoğunluk yapıları dikkate alınır • Farklı sorular aynı değişkenin göstergeleriyse birbiriyle ampirik olarak ilişkili olmalı • İki değişken arasında mükemmel bir istatistik korelasyon olması sosyal araştırmalarda nedensellik için gerekli bir koşul, ama yeterli bir koşul değil