13 Temmuz 2011 Çarşamba

ÇOK BOYUTLU ÖLÇEKLEME ANALİZİ VE SPSS, R PROJECT UYGULAMALARI


 
Çok Boyutlu Ölçekleme Analizi,  nesneleri arasındaki gizli yapıları yakınlık ölçüleri aracılığı ile ortaya çıkaran çok değişkenli bir boyut indirgeme metodudur. Gizli yapılardan sözcüğü ile anlatılmak istenen, nesnelerin birbirleri ile olan karşılıklı ilişkileridir. Bu teknik sayesinde p sayıdaki değişken yerine k sayıda boyut kullanılarak (p>k) nesnelerin karşılaştırmalı yapısı gözlenebilmektedir. Ç.B.A, nesneler arasında karşılaştırma yapabilmek için grafiksel gösterimler sunmaktadır. Teorik açıdan inceleyecek olursak, n tane nesne p boyutlu uzayda noktalar kümesi oluşturmaktadır. Bu teknik ile amaçlanan esas şey, bu noktalar kümesini orijinal halini bozmadan daha düşük boyutlu bir uzayda gösterebilmektir.

Ç.B.A Psikoloji, Politik Bilimler, Pazarlama gibi birçok farklı alanda kullanılmaktadır. Politik bilimlerde seçmenlerin adaylar arasındaki algılama düzeyini ölçmek için kullanılmaktadır. Psikologlar bireylerin konuşma şekli, kişilik yapıları gibi çeşitli özelliklerini değerlendirmek üzere Ç.B.A tekniğini uygulamaktadır. Pazar araştırmacıları tüketicilerin ürün özellikleri açısından değerlendirmelerini karşılaştırmak için bu yöntemi kullanmaktadır.

Ç.B.A diğer çok değişkenli istatistiklere göre daha avantajlı bir tekniktir çünkü Ç.B.A için herhangi bir dağılıma uyma zorunluluğu bulunmamaktadır. Ayrıca nesneler arasındaki ilişkiler grafiksel gösterim aracılığı ile rahatlıkla gözlenebilmektedir. Ç.B.A verilerin ölçek tipine genel olarak üç kategoriye ayrılmaktadır:

 1.  Metrik  Ç.B.A 
  2.  Metrik Olmayan Ç.B.A
 3.  Klasik Ç.B.A

Metrik Ç.B.A analizi veriler aralıklı ve oransal ölçekli olduğu durumlarda kullanılmaktadır. Metrik olmayan Ç.B.A veriler sınıflayıcı veya sıralayıcı ölçekli olduğu durumlarda uygulanmaktadır. Klasik Ç.B.A analizi 1952 yılında Torgensen tarafından ortaya atılmış ve popüler hale gelmiştir. Klasik Ç.B.A diğer yöntemlere göre teknik açıdan farklılık göstermektedir. Metrik ve metrik olmayan yöntemlerin aksine herhangi bir iteratif işlem kullanılmadan gerçekleştirilmektedir. Klasik Ç.B.A spektral ayrıştırma kullanılarak, Temel Bileşenler Analizine benzer şekilde nesneleri daha düşük boyutlu bir uzayda konumlandırmaktadır.

Ç.B.A diğer çok değişkenli tekniklerde olduğu gibi ham X verileri ile işlem görmemektedir. Bunun yerine verinin yapısına göre yakınlık ölçüsü olarak tanımlayabileceğimiz farklılık veya benzerlik ölçülerinden herhangi biri seçilerek uzaklık matrisi elde edilmekte ve D uzaklık matrisinden yararlanılmaktadır. Uzaklık matrisi oluşturulmadan önce, farklı ölçekli veriler kullanıldığında standardizasyon işlemi gerçekleştirilmelidir. İkili ölçekli değişkenler için standardizasyon işlemi uygulanamaz.

Metrik ve metrik olmayan Ç.B.A’ da verilerin uzaklıklarına göre uygun regresyon metodu seçilerek tahmini gösterim (konfigürasyon) uzaklıkları hesaplanmaktadır. Uygun regresyon metodu (doğrusal, monotik, polinominal) serpilme diyagramı incelenerek seçilmelidir. Metrik olmayan Ç.B.A için iteratif şekilde Shepard Algoritması kullanılmaktadır. Uzaklıklar ve sıralamalar arasındaki ilişkiye göre PAV (pool-adjacent violator) algoritması da kullanılabilir. Tahmini gösterim uzaklıkları hesaplandıktan sonra, bu uzaklık değerleri kullanılarak farklılık matrisi elde edilir. Farklılık matrisi incelenerek daha düşük boyutlu uzayda nesneler arasında karşılaştırma yapılabilmektedir.  Mevcut uzaklık ve tahmini gösterim uzaklık değerleri arasındaki uyumu ölçebilmek için stres istatistiği hesaplanır. Bu istatistiğe ilişkin değer aralıklarına göre uyum düzeyi ölçülebilir. Stres tablosu aşağıdaki gibidir:

Stres Değeri
Uyum Düzeyi
0-0,025
Mükemmel
0,025-0,05
Çok iyi
0,05-0,1
İyi
0,1-0,2
Orta
0,2 ve üzeri
Düşük

Boyut indirgeme sonucunda boyut sayısını belirlemek için stress istatistiğine bakılmaktadır. Stres istatistiği iterasyonlar sonucunda belirli bir değere yakınsamaktadır. Yakınsanan değere ait olan boyut sayısı seçilebilir. Bu yöntem haricinde ham veri matrisi ve transpozunun çarpımı ile elde edilen pozitif yarı tanımlı B matrisinin özdeğerleri kullanılarak boyut sayısına karar verilebilir. Özdeğerler toplam değerinin toplam pozitif özdeğerleri bölünmesi ile elde edilen değer kadar boyut seçilebilir. Teorik altyapı çok fazla detay içerdiğinden detaylara girmeyeceğim. Uygulamada genel olarak 2 veya 3 boyut seçilmektedir. Boyut sayısı çoğaldıkça gösterim güçlüğü artacağı için 2 veya 3 boyut tercih edilmektedir. Boyut sayısına göre nesnelere ilişkin her boyuta ait koordinat değerleri hesaplanmaktadır. Koordinat değerlerine bakılarak hangi boyutta hangi nesnelerin daha baskın özellik taşıdığı tespit edilebilmektedir.
Ç.B.A’ yı uygulamak üzere R Project ve SPSS programlarına ilişkin kodlar ve çeşitli çıktılar okuyucuya sunulmaktadır. Veri setine ait olan veri setinin ismi vedeğişken isimleri değiştirilerek analiz gerçekleştirilebilmektedir. Ayrıca analize ilişkin diğer isim ve sayısal değerler de değiştirilebilir. Elde edilen çıktılar, elimdeki çeşitli veri setleri kullanılarak sonuçların sadece bir kısmıdır.


R KODLARI VE ÇIKTILARI


# Klasik Ç.B.A
d <- dist(hayaliveri)     # Satırlar arasındaki Öklid uzaklıkları
fit <- cmdscale(d,eig=TRUE, k=2)   # k , boyut sayısı
fit   # Tahmin sonucu

# Grafiksel çözüm
x <- fit$points[,1]
y <- fit$points[,2]
plot(x, y, xlab="Coordinate 1", ylab="Coordinate 2", main="Metric MDS", type="n")
text(x, y,  labels = row.names(hayaliveri), cex=.7)



# Metrik Olmayan Ç.B.A

d <- dist(hayaliveri)     # Satırlar arasındaki Öklid uzaklıkları
fit <- cmdscale(d,eig=TRUE, k=2)   # k , boyut sayısı
fit   # Tahmin sonucu

# Grafiksel çözüm
x <- fit$points[,1]
y <- fit$points[,2]
plot(x, y, xlab="Coordinate 1", ylab="Coordinate 2", main="Metric MDS", type="n")
text(x, y,  labels = row.names(hayaliveri), cex=.7)




SPSS KODLARI VE ÇIKTILARI



/MATRIX=IN('C:\Users\User\AppData\Local\Temp\spss4520\hayaliveri')
/LEVEL=ORDINAL
/CONDITION=MATRIX
/MODEL=EUCLID
/CRITERIA=CONVERGE(0.001) STRESSMIN(0.005) ITER(30) CUTOFF(0) DIMENS(2,2)
/PLOT=DEFAULT ALL
/PRINT=DATA HEADER.












Hiç yorum yok: