İstatistikteki Temel Tanımlar – 2 (Değişkenler Arası İlişkiler Neden Önemlidir ?)

Değişkenler arası ilişkiler: Tiplerinden bağımsız iki veya fazla sayıda değişkenin ilişkili olması için bir gözlemler örnekleminde bu değişken değerlerinin tutarlı bir biçimde dağılmış olması gerekmektedir. Diğer bir değişle, değerler her bir gözlem için diğeriyle sistematik bir biçimde uyumluysa değişkenler ilişkilidir. Mesela, eğer çoğu erkek yüksek BHS’a ve çoğu bayan düşük BHS’a veya tam tersi bir durum mevcut ise BHS ve cinsiyet birbirleriyle ilişkilidir diyebiliriz. Aynı şekilde yükseklik ağırlıkla ilişkilidir, çünkü tipik olarak uzun boylular ufak boylulara göre daha kiloludurlar.

Değişkenler Arası İlişkiler Neden Önemlidir?

Her araştırma veya bilimsel analizin amacı değişkenler arasında ilişki bulmaktır. Bilimin gelişimi her zaman değişkenler arası yeni ilişkiler bulmakla olur. Korelasyonel araştırma bu tip ilişkileri en iyi şekilde anlatan çözümdür. Fakat deneysel araştırma bu bağlamda farklı değildir. Mesela az önce anlatmış olduğum erkek ve dişilerdeki HBS’lerin karşılaştırılması iki değişken arasındaki korelasyonu bulmak olarak nitelendirilir: Cinsiyet ve HBS. İstatistik değişkenler arası ilişkiyi değerlendirmek dışında başka bir şey yapmaz. Gerçekten de bu yazı dizisinde anlatacaklarım yüzlerce prosedür çeşitli tiplerdeki değişken ilişkilerinin değerlendirilmesini içerecektir.

Tüm değişkenler arasında bulunan ilişkilerin temel iki özelliği: Bunlar (a) büyüklük (magnitude) veya ölçü (size), ve güvenilirliktir (reliability / truthfulness)

a. Magnitude (or size): Magnitude reliability’e göre daha kolay anlaşılır ve ölçülür. Mesela örneğimizdeki her erkeğin HBS’si dişilerden yüksek çıkıyorsa, değişkenler arası (Cinsiyet ve HBS) ilişkinin magnitude‘u yüksektir diyebiliriz. Diğer bir değişle, birini diğerine göre tahmin edebiliriz (en azından örneğimizideki üyeler arasında).

b. Reliability (or truthfulness): Reliability spesifik örneğimizde bulduğumuz sonucu bütün popülasyona genelleyebilmemizi sağlar. Diğer bir değişle, deney sonucunda ortaya çıkan ilişkinin aynı popülasyondan çekilen farklı örneklemlerde de tekrarlanma ihtimalini ortaya çıkarır.

Hatırlayalım ki biz hemen hemen örneklemimizde sonuç olarak yaknızca ne olduğuyla asla ilgilenmeyiz; sadece örneklem bize popülasyon hakkında bilgi verdiği ölçüde önem gösteririz. Eğer çalışmamız spesifik bir kriter hakkında ise, örneklemimizde gözlemlenen değişkenlerin arasındaki ilişkinin güvenilirliği nicel olarak tahmin edilebilir ve standart bir ölçüm (teknik olarak p-değeri veya istatistiksel anlamlılık – significance – seviyesi olarak adlandırılır) ile tanımlanabilir.

İstatistiksel Anlamlılık – Significance – (P-değeri) nedir?:

Bir sonucun istatistiksel anlamlılığı örneklemdeki gözlemlenen ilişki (değişkenler arasında) veya farklılığın (ortalamalar hakkında) sadece şans eseri (luck of the draw) oluşması ihtimalidir ve bu örneğin seçildiği popülasyonda bu tip bir ilişki veya farklılık bulunmamaktadır.

Daha doğrusu, bir sonucun istatistiksel anlamlılığı bize sonucun doğru (popülasyonu temsil etmesi bakımından) olarak kabul edilme derecesini söyler. Yani p-değeri bir sonucun azalan bir indexte reliability’sini gösterir. P-değeri küçüldükçe, bulguların geçerli olma olasılığı o derecede artar. P değeri gözlemlenen sonucumuzun geçerli olduğu görüşünü, yani sonucun “popülasyonu temsilcisi” olduğunu içeren hata ihtimalini gösterir.

Örnek verecek olursak eğer p değeri 0.05 ise (mesela 1/20), değişkenler arasındaki ilişkinin şans eseri olma ihtimali % 5’tir (Yani değişkenler arası ilişki % 95 oranında şans eseri değildir). Bir çok araştırma alanında 0.05’lik bir p-değeri kabul edilebilecek sınır hata seviyesi olarak alımıştır.

Bir sonucun “gerçekten” anlamlı olduğuna nasıl karar verebiliriz?

Sonuç aşamasında hangi anlamlılık seviyesinin gerçekten “anlamlı” olarak değerlendirileceğini bilemeyiz. Dolayısıyla anlamlılık seviyesi seçiminde, hangi sonuçların geçersiz olarak reddedileceği konusu keyfidir.

p

Bir Cevap Yazın