Veri seti
Bu çalışmada yapılan yazılımın çalışma şeklini gösterebilmek ve çıktılarını değerlendirebilmek adına iki değişkenden oluşan her bir değişkenin standart normal dağılıma sahip olduğu ve değişkenlerin 1000 gözlem içerdiği veri seti IBM SPSS Statistics sürüm 25.0'ın model sekmesi (simülasyon) ile türetilmiştir.
Normallik analizleri
Bu web tabanlı yazılım araştırıcıların sahip olduğu veri setlerini tek ve çok değişkenli normal dağılıma uygunluğunu test etmek amacıyla geliştirilmiştir. Geliştirilen yazılımda tek değişkenli normal dağılıma uygunluk Shapiro-Wilk ve Anderson-Darling testleri ile test edilirken, çok değişkenli normal dağılıma uygunluk ise Mardia’nın çarpıklıkbasıklık, Henze-Zirkler ve Door-nik-Hansen testleri ile test edilmektedir. Bu testler dışında yer alan ve normallik sınamasında kullanılabilen grafiksel metotlardan olan Q-Q, çekirdek yoğunluk kestirim ve 3-boyutlu yüzey grafikleri de araştırmacıların kullanımı amacıyla yazılımda yer almaktadır. Ayrıca geliştirilen yazılım ile veri seti yapısına bağlı olarak veride nitel değişken(ler)in varlığı durumunda alt grup analizlerinin yapılmasına olanak sağlanmıştır.
Shapiro-Wilk Testi
Normallik testlerinden olan Shapiro-Wilk testi ilk defa Samuel Shapiro ve Martin Wilk tarafından 1965 yılında yayınlanmıştır 14. Bu test için kurulacak sıfır hipotezi bir örneklemden elde edilen veri serisinin normal dağılım gösteren bir topluma ait olmasıdır. Yani
serisinin normal dağılım gösteren bir topluma ait olmasıdır.
Shapiro-Wilk test istatistiği olan W şu şekilde elde edilir:
Küçükten büyüğe doğru sıralanmış
için normal dağılım değerleri olan αi
değerleri şöyle bulunur.
olup
standart normal dağılımdan örneklem olarak bulunmuş bağımsız ve aynı dağılımı gösteren rastgele değişkenlerin sıra istatistikleri değerlerine ait beklenen değerlerdir. V ise bu sıra istatistikleri için elde edilen kovaryans matrisidir. Son olarak W istatistiği ise

olarak elde edilir 14.
W test istatistiği
aralığında değişim göstermektedir. W test istatistiğinin 1’e yakın değerler alması değişkenin normal dağılıma sahip olduğunu, 0’a yakın değerler alması ise değişkenin normal dağılıma sahip olmadığını gösterir 14.
Anderson-Darling Testi
Anderson-Darling testi deneysel dağılım fonksiyonu istatistiklerine dayandırılarak 1974 yılında Anderson ve Darling tarafından geliştirilen bir testtir. Bu testte uygulanacak verilerin ham veri olması gerekir. Anderson-Darling testi gözlenen birikimli dağılım fonksiyonunun beklenen birikimli dağılım fonksiyonuna uyumunu karşılaştırabilmek içn kullanılan bir testtir 14.
Anderson-Darling testi büyüklük sırası gösteren χi
gözlemlerinin deneysel yığılımlı olasılık dağılımının yığılımlı standart normal dağılıma uygun olup olmadığını test eder. Bu işlem için her bir gözlemin standart dönüşümleri yapılarak Ζi
gözlemleri elde edilir. Böylece elde edilen standart Ζi değerlerinin olasılıklarının standart normal dağılıma uygunluğu test edilir. Bu nedenle Anderson-Darling testinden bir Α2
test istatistiği hesaplanarak verilerin normal dağılıma uygunluğu test edilir. Α2
Anderson-Darling test istatistiği

olarak elde edilir.
Burada yer alan F0(Ζi) değeri; standart normal dağılımın Ζi noktasındaki yığılımlı olasılık değerini, n ise örnek gözlem sayısını göstermektedir 14. Α2 test istatistiği küçük örneklem genişliğine sahip veri setleri içn düzeltilerek kullanılır. Düzeltilmiş Α2 test istatistiği ise

ile elde edilir 14.
Mardia’ nın çarpıklık-basıklık testi
Mardia tarafından önerilen ve çok değişkenli çarpıklık ve basıklık testleri, tek değişkenli çarpıklık ve basıklık ölçümlerini içeren t istatistiğinin gücünü genişletme çalışmaları ile 1970 yılında geliştirilmiştir. Ortalama değeri µ
ve kovaryans matrisi µ
olan p değişkenli bir evrende X için Mardia evrene ait çok değişkenli çarpıklık ve basıklık ölçümlerini aşağıdaki gibi vermiştir 15,16.
Burada X ve Y bağımsız olarak özdeş olarak dağılır.
Çok değişkenli çarpıklık ve basıklık katsayıları sırasıyla (Ŷ1p)
ve (Ŷ2p)
katsayılarına bağlı olarak hesaplanır. (χ1, χ2, ...χn)
verisinin ortalama değeri
ve kovaryans matrisi
olan p değişkenli bir evrenden rastgele alınarak elde edilen bir örnek olduğu kabul edilirse, buna ait çok değişkenli çarpıklık ve basıklık katsayıları;

dir.
Elde edilen katsayılara bağlı olarak çarpıklık ve basık-lık testi için sırasıyla elde edilecek test değerleri


ile hesaplanır 16.
Henze-Zirkler
Henze-Zirkler testi Epps ve pulley tarafından 1983 yılında geliştirilen tek değişkenli normalliğin belirlenmesi için önerilen testin çok değişkenli normal dağılım durumu için genelleştirilmiş halidir. Ayrıca 1988 yılında Baringhaus ve Henze tarafından önerilen testin de genel halidir 17.
Çok değişkenli normal dağılımı belirlemek için kullanılan Henze-Zirkler test istatistiği düzleştirme parametresi olan β nın bir fonksiyonu olup

Doornik-Hansen
Doornik ve Hansen tarafından 1994 yılında geliştirilen bu test Bowman ve Shenton tarafından 1975 yılında önerilen çarpıklık ve basıklık katsayılarına bağlı geliştirilen tek değişkenli normallik testi test istatistiğinin çok değişkenli halidir.
bir veri kümesi, p boyutlu bir vektörde n gözlemli pxn boyutlu bir matris olduğunda örneklem ortalaması
dir.
Standart sapmaların tersleriyle köşegen (diyagonal) matris;

korelasyon matrisi C=VSV şeklinde oluşturulur. Verilerin dönüştürülmesi ile ilgili pxn boyutlu matris

şeklinde tanımlanır.
Burada
köşegen (diyagonal) elemanlarda C’nin özdeğerli matrisidir. H’nin sütünları özvektörlerdir. Öyle ki
dir. C ve V için popülasyon değerlerini kullanarak çok değişkenli normal dağılım, bağımsız standart normal dağılımlara dönüştürülebilir. Dönüştürülen gözlem değerlerinden tek değişkenli eğrilik ve diklik katsayıları hesaplanabilir.
Doornik-Hansen testi için test istatistiği,

