top of page

İstatistiğe Giriş Notları: Sosyal Bilimciler İçin Temel Kavramlar

  • Yazarın fotoğrafı: Hasan Bakır
    Hasan Bakır
  • 18 Eki
  • 7 dakikada okunur

Güncelleme tarihi: 5 Kas

ree

Günümüzde veriler, hayatımızın her alanında karar vermemizi etkileyen en değerli kaynaklardan biri hâline geldi. Sosyal bilimlerden eğitime, iş dünyasından günlük yaşama kadar pek çok alanda verileri doğru analiz edebilmek, yanıltıcı sonuçlardan kaçınmayı ve sağlıklı çıkarımlar yapmayı mümkün kılar. İstatistik, bu noktada verileri anlamlandırmanın ve bilinçli kararlar almanın temel aracıdır.


 İstatistik Nedir?


İstatistik, belirli bir amaç doğrultusunda verilerin toplanması, düzenlenmesi, çözümlenmesi ve yorumlanması sürecini kapsayan bir bilim dalıdır. Başka bir ifadeyle, istatistik; araştırma sorularına yanıt aramak ya da hipotezleri test etmek için kullanılan yöntemler bütünüdür.


Sosyal bilimlerde istatistik öğrenmenin temel amacı, bir araştırmadan elde edilen verilerin anlamlı biçimde nasıl yorumlanacağını ve hangi yöntemlerle analiz edileceğini bilmektir. Çünkü veriler, tek başına bir anlam taşımaz; doğru tekniklerle analiz edilmediğinde yanıltıcı sonuçlara yol açabilir.


Betimsel ve Anlam Çıkartıcı (Kestirisel) İstatistik


İstatistik iki ana kategoriye ayrılır:


  1. Betimsel (Tanımlayıcı) İstatistik:Verilerin özetlenmesi, sınıflandırılması ve düzenlenmesiyle ilgilenir.Örneğin, bir sınıftaki öğrencilerin sınav ortalamasını, en yüksek puanı veya not dağılımını belirlemek betimsel istatistiğin konusudur.

  2. Anlam Çıkartıcı (Kestirisel) İstatistik:Bir örneklemden yola çıkarak evren hakkında tahmin ve genelleme yapmayı sağlar.Örneğin, 100 kişilik bir örneklem üzerinden Türkiye’deki genel memnuniyet düzeyini tahmin etmek bu kategoriye girer.Bu aşamada hipotez testleri (örneğin t-testi, varyans analizi, ki-kare testi) devreye girer.


İstatistik ve Araştırma İlişkisi


Sosyal bilimlerde araştırma, insan davranışlarını anlamayı ve bu alandaki bilgi birikimini geliştirmeyi amaçlayan sistemli bir süreçtir.


Bu süreçte yapılan ölçümlerden elde edilen her sonuç bir veri (data) olarak adlandırılır.


İstatistiksel yöntemler, bu verilerden anlamlı sonuçlar çıkarma ve yorumlama imkânı sunar.


 Temel Kavramlar


 Evren (Popülasyon)


Araştırma kapsamına giren ve ortak özelliklere sahip tüm bireylerin ya da nesnelerin oluşturduğu gruptur. Örneğin, “Türkiye’deki tüm üniversite öğrencileri” bir evrendir. Evrene ait sayısal özelliklere parametre denir.


Örneklem


Evrenin tamamına ulaşmak genellikle mümkün olmadığından, evreni temsil eden daha küçük bir grup seçilir. Bu gruba örneklem denir.


Örneklemdeki özelliklere ait sayısal değerler ise istatistik olarak adlandırılır.


Araştırma Birimi ve Katılımcı


Üzerinde ölçüm yapılan birey, grup veya nesnedir. Sosyal bilimlerde bu birimler genellikle bireyler veya gruplar şeklindedir ve “katılımcı” ya da “denek” olarak da adlandırılır.


Değişken (Variable)


Bir özelliğin bireyden bireye farklılık göstermesi durumuna değişken denir. Değişkenler genellikle X, Y, Z gibi sembollerle gösterilir.


Örneğin: yaş, gelir düzeyi, eğitim seviyesi, cinsiyet, tutum puanı gibi. Eğer bir özelliğin yalnızca tek değeri varsa (örneğin tüm bireylerin aynı yaştaysa) buna sabit denir.


Değişken Türleri


1. Nicel (Kantitatif) Değişkenler: Sayısal olarak ifade edilebilen değişkenlerdir. Örnekler: gelir miktarı, boy, kilo, sınav puanı, çocuk sayısı.


2. Nitel (Kategorik) Değişkenler: Sayısal değil, sınıflara ayırarak tanımlanan değişkenlerdir. Örnekler: cinsiyet (kadın/erkek), din, meslek, medeni durum, konuşulan dil. Bu değişkenlerin alt kategorileri vardır, ancak kategoriler arasında büyüklük-sıralama ilişkisi bulunmaz.


Sürekli ve Süreksiz Değişkenler


Süreksiz Değişken


Belirli ve sınırlı değerler alabilir; genellikle sayma ile elde edilir. Örneğin: çocuk sayısı, sınıf mevcudu, futbol takımı üye sayısı.


Sürekli Değişken


İki ölçüm arasında sonsuz sayıda değer alabilir. Genellikle ölçümle elde edilir ve kesirli değerler alabilir. Örneğin: boy uzunluğu, kilo, zeka puanı, sıcaklık. Bir öğrencinin ağırlığı 62,3 kg olabilir; ancak sınıf mevcudu 25,5 olamaz.


Bağımlı ve Bağımsız Değişkenler


Bağımsız değişken (X): Araştırmacının kontrol edebildiği, sonucu etkileyebilecek faktördür.


Bağımlı değişken (Y): Etkisi incelenen, sonuç olarak ortaya çıkan değişkendir.


Örnek:Bilgisayar destekli öğretimin, öğrencilerin başarı düzeyini artırıp artırmadığı araştırılıyorsa:

  • Bağımsız değişken = Öğretim yöntemi

  • Bağımlı değişken = Öğrenci başarısı


Ölçme Düzeyleri


İstatistikte ölçme dört farklı düzeyde yapılır:

  1. Sınıflama (Nominal) Ölçeği:Kategorilere ayırır, miktar belirtmez.Örneğin: Cinsiyet, memleket, takım ismi.Her birey yalnızca bir kategoriye ait olabilir.

  2. Sıralama (Ordinal) Ölçeği:Veriler sıralanabilir ancak aralarındaki fark bilinmez.Örneğin: Saldırganlık düzeyi (yüksek-orta-düşük) veya sınavda derece sırası.

  3. Aralık (Interval) Ölçeği:Eşit ölçüm birimleri vardır ama “gerçek sıfır noktası” yoktur.Örneğin: Sıcaklık (0°C sıcaklığın yokluğu anlamına gelmez).Bu düzeyde ortalama, standart sapma, korelasyon gibi işlemler yapılabilir.

  4. Oran (Ratio) Ölçeği:Gerçek sıfır noktasına sahiptir, bu yüzden oranlama mümkündür.Örneğin: kilo, uzunluk, yaş, gelir.“Ali’nin kilosu Ayşe’nin iki katı” gibi ifadeler bu ölçekte anlamlıdır.


Ondalık Sayılar ve Yuvarlama


Uygulamada sürekli değişkenlere ilişkin ölçümler genellikle tam sayılarla ifade edilir. Bu nedenle, ondalık sayı olarak elde edilen ölçme sonuçları genellikle en yakın tam sayıya yuvarlanır (Ancı, 1993).


Burada temel kural şudur: Yok edilmek istenen basamaktaki sayı 5’ten büyükse, bir önceki basamaktaki sayıya bir eklenir; 5’ten küçükse, önceki sayı aynı kalır (Kural 1).


Örnek:


·           Matematik sınav puanı 3,6 olan bir öğrencinin puanı 4’e,

·           3,2 olan bir öğrencinin puanı ise 3’e yuvarlanır.


Ondalıklı sayılar yalnızca tam sayıya değil, istenirse belirli bir ondalık basamağa kadar da yuvarlanabilir.


Örnek:23.4682 sayısını iki kesir hanesine (yüzde birler basamağına) yuvarlayalım:

·           Dördüncü kesir hanesindeki sayı 2’dir ve 5’ten küçük olduğu için atılır → 23.468 kalır.

·           Üçüncü kesir hanesindeki 8 sayısı 5’ten büyük olduğundan bir önceki haneye 1 eklenir → sonuç 23.47 olur.

Yok edilmek istenen kesir hanesindeki sayı 5 ise ve 5’ten sonraki tüm haneler 0 ise, farklı bir kural uygulanır (Kural 2). Bu durumda:

·           5’ten önceki sayı tek ise, bir artırılır.

·           Çift ise, olduğu gibi bırakılır.


Örnek:

·           19.25 → 19.2

·           19.35 → 19.4

·           2.1500 → 2.2

Buna karşılık, bazı durumlarda yuvarlama işlemi tam olarak bu kurallara göre yapılamayabilir. Örneğin, 6.54501 sayısını yüzde birler basamağına (ikinci kesir hanesine) yuvarlayalım:

·           6.54501 → 6.55 olur, çünkü yüzde birler basamağından sonra gelen sayı 500’den büyüktür ve bir önceki basamağa 1 eklenir.

Benzer şekilde, 6.57478 sayısı yüzde birler basamağına yuvarlandığında 6.57 olarak kalır, çünkü yüzde birler basamağından sonra gelen sayı 500’den küçüktür.


Özet:

  • 5’ten büyükse → bir üst sayıya yuvarlanır.

  • 5’ten küçükse → aynı kalır.

  • Sayı tam 5 ise ve ardından yalnızca sıfırlar geliyorsa:

    • Önceki basamak tek ise bir artırılır.

    • Önceki basamak çift ise sabit kalır.


Temel İstatistiksel Testler


T-testi (t-test)


İki ortalama arasındaki farkın anlamlı olup olmadığını test eder. Yani “bu iki grup arasında gerçekten fark var mı, yoksa tesadüf mü?” sorusuna cevap verir.


Türleri:


1.        Bağımsız örneklem t-testi:İki farklı grup karşılaştırılır.Örnek: Erkekler ile kadınların sınav puan ortalaması farkı var mı?

2.        Bağımlı (eşleştirilmiş) t-testi:Aynı grubun iki ölçümü karşılaştırılır.Örnek: Bir grubun eğitim öncesi ve sonrası başarı puanları farkı var mı?


Varyans Analizi (ANOVA)


İkiden fazla grup ortalaması arasında fark olup olmadığını test eder. T-testi yalnızca iki grup içindir; ANOVA üç veya daha fazla grup için kullanılır.


Türleri:


1.        Tek yönlü ANOVA:Tek bir bağımsız değişken (örneğin “öğrenim düzeyi”)→ Lisans, yüksek lisans, doktora öğrencileri arasında fark var mı?

2.        İki yönlü (faktöriyel) ANOVA:İki bağımsız değişken (örneğin “cinsiyet” ve “öğrenim düzeyi”)→ Cinsiyet ve öğrenim düzeyine göre başarı farkı var mı?

3.        Tekrarlı ölçümler ANOVA’sı:Aynı grubun farklı zamanlardaki ölçümleri karşılaştırılır (örneğin 3 zaman noktası).


Ki-kare testi (χ² testi)


Kategorik (sayısal olmayan) veriler arasındaki ilişkiyi test eder. Yani “iki değişken arasında ilişki var mı?” sorusuna yanıt verir.


Örnekler:


·           Cinsiyet (kadın/erkek) ile sigara içme durumu (evet/hayır) arasında ilişki var mı?

·           Eğitim düzeyi ile tercih edilen haber kaynağı arasında fark var mı?


Veri tipi: frekanslar veya oranlar (örn. 30 kadın, 20 erkek vb.)


Ortanca (Medyan)


Bir veri dizisini küçükten büyüğe sıraladığımızda tam ortada kalan değerdir. Verilerin yarısı bu değerden küçük, yarısı büyüktür.


·           Örnek: 3, 5, 7, 9, 11 → Ortanca = 7

·           Kullanım: Veriler çok uç değerler içerdiğinde (örneğin gelir dağılımı) ortalama yerine ortanca tercih edilir.


Yüzdelik (Percentil)


Veri grubunu 100 eşit parçaya bölen değerdir.


·           Örneğin, 70. yüzdelik (P70) bir öğrencinin, grubun %70’inden daha yüksek puan aldığını gösterir.

·           Eğitimde, sınav değerlendirmelerinde sık kullanılır.


Çeyrek Sapma (Quartile Deviation)


Verilerin ortadaki %50’lik kısmının yayılımını gösteren bir değişkenlik ölçüsüdür.


Formülü:


ree

Burada:

·           Q1 (1. çeyrek) = verilerin %25’inin altında kaldığı değer

·           Q3 (3. çeyrek) = verilerin %75’inin altında kaldığı değer


Örnek:

Q1 = 20, Q3 = 40 ise

Çeyrek Sapma = (40 - 20) / 2 = 10


Sıra Farkları Korelasyon Katsayısı (Spearman’s Rho, ρ)


İki sıralanabilir değişken arasındaki ilişkiyi ölçer. Veriler normal dağılmadığında, Pearson korelasyonu yerine kullanılır.


Formülü:


ree


Burada:


·           d = iki değişkenin sıraları arasındaki fark

·           n = gözlem sayısı

Yorum:


·           ρ = +1 → güçlü pozitif ilişki

·           ρ = -1 → güçlü negatif ilişki

·           ρ = 0 → ilişki yok


Örnek: Ders çalışma süresi ile sınav başarısı sıraları arasında pozitif ilişki varsa, ρ > 0 çıkar.


➕➖ İşaret Testi (Sign Test)


İki bağımlı ölçüm (örneğin ön test – son test) arasında fark olup olmadığını test eder.Verilerin normal dağılmadığı durumlarda bağımlı t-testine alternatif olarak kullanılır.


Mantık: Sadece farkların işaretine bakılır (+ ya da −).


·           Pozitif ve negatif fark sayıları karşılaştırılır.

·           Eğer farkların yönü çoğunlukla tek bir tarafta ise anlamlı fark vardır.


Mann-Whitney U Testi


İki bağımsız grup arasında fark olup olmadığını test eden nonparametrik bir testtir. Yani bağımsız örneklem t-testinin parametrik olmayan karşılığıdır.


Kullanım örneği:


·           Erkek ve kadın öğrencilerin stres puanları arasında fark var mı?

·           Veriler normal dağılmıyorsa → t-testi yerine Mann-Whitney U kullanılır.


Mantık: Tüm veriler küçükten büyüğe sıralanır, her değere bir sıra numarası verilir.Grupların sıra toplamları karşılaştırılarak farkın anlamlılığı test edilir.


Tablo Halinde Temel İstatistiksel Testler


Kavram/Test

Tanım

Türleri / Kullanım Alanı

Örnek / Yorum

T-testi (t-test)

İki ortalama arasındaki farkın tesadüfî olup olmadığını test eder.

1. Bağımsız örneklem t-testi: İki farklı grup karşılaştırılır.2. Bağımlı (eşleştirilmiş) t-testi: Aynı grubun iki ölçümü karşılaştırılır.

- Erkekler ile kadınların sınav puan ortalaması farkı var mı?- Bir grubun eğitim öncesi ve sonrası başarı puanları arasında fark var mı?

Varyans Analizi (ANOVA)

İkiden fazla grup ortalaması arasındaki farkı test eder. T-testinin üç veya daha fazla gruplu versiyonudur.

1. Tek yönlü ANOVA: Tek bir bağımsız değişken (örneğin öğrenim düzeyi).2. İki yönlü (faktöriyel) ANOVA: İki bağımsız değişken (örneğin cinsiyet ve öğrenim düzeyi).3. Tekrarlı ölçümler ANOVA’sı: Aynı grubun farklı zamanlardaki ölçümleri karşılaştırılır.

- Lisans, yüksek lisans, doktora öğrencileri arasında başarı farkı var mı?- Cinsiyet ve öğrenim düzeyine göre başarı farkı var mı?- Bir grubun üç farklı zamanda ölçülen performansı arasında fark var mı?

Ki-kare testi (χ² testi)

Kategorik (nitel) değişkenler arasındaki ilişkiyi test eder.

Frekans veya oran verileriyle çalışır.

- Cinsiyet (kadın/erkek) ile sigara içme durumu (evet/hayır) arasında ilişki var mı?- Eğitim düzeyi ile tercih edilen haber kaynağı arasında fark var mı?

Ortanca (Medyan)

Veriler sıralandığında ortada kalan değerdir. Uç değerlerden etkilenmez.

Ortalama yerine, özellikle dağılımın bozuk olduğu durumlarda tercih edilir.

Örnek: 3, 5, 7, 9, 11 → Ortanca = 7Gelir dağılımı analizlerinde sıkça kullanılır.

Yüzdelik (Percentil)

Verileri 100 eşit parçaya böler.

P70 → bireyin grubun %70’inden yüksek puan aldığı anlamına gelir.

Eğitim ve sınav değerlendirmelerinde kullanılır.

Çeyrek Sapma (Quartile Deviation)

Verilerin ortadaki %50’lik kısmının yayılımını gösterir.

Formül: (Q3 − Q1) / 2 Q1: Alt çeyrek (%25)Q3: Üst çeyrek (%75)

Örnek: Q1=20, Q3=40 → Çeyrek sapma = 10Dağılımın orta kısmındaki değişkenliği ölçer.

Sıra Farkları Korelasyon Katsayısı (Spearman’s Rho, ρ)

İki sıralanabilir değişken arasındaki ilişkiyi ölçer. Veriler normal dağılmadığında kullanılır.

Formül: ρ = 1 - [(6Σd²) / n(n² - 1)]d: sıra farkın: gözlem sayısı

ρ = +1 → güçlü pozitif ilişkiρ = -1 → güçlü negatif ilişkiρ = 0 → ilişki yok.Örnek: Ders çalışma süresi ile başarı sırası arasında pozitif ilişki.

İşaret Testi (Sign Test)

İki bağımlı ölçüm arasındaki farkın anlamlı olup olmadığını test eder. Nonparametriktir.

Farkların sadece yönü (+ veya −) dikkate alınır.

Ön test ve son test arasında farkın yönüne bakılır.Farkların çoğu aynı yönde ise anlamlı fark vardır.

Mann-Whitney U Testi

İki bağımsız grup arasındaki farkı test eden nonparametrik yöntemdir.

Bağımsız örneklem t-testinin parametrik olmayan karşılığıdır.

- Erkek ve kadın öğrencilerin stres puanları arasında fark var mı?- Veriler normal dağılmıyorsa t-testi yerine kullanılır.


Yorumlar


©2022, Hasan Bakır tarafından kurulmuştur.

bottom of page