15 Haziran 2011 Çarşamba

DOĞRUSAL REGRESYON ANALİZDE DEĞİŞKEN DÖNÜŞÜMÜ

Bağımlı (Y) ve bağımsız (X) değişkenlerin dönüştürülmesi konusu, regresyon analizinde önemli bir konuma sahiptir. Değişken dönüşümünde tercih edilecek dönüşümün seçimi çeşitli problemler içerebilmektedir. Doğrusal regresyon modelinde dönüşüm gerçekleştirilmesinin çeşitli sebepleri vardır. Değişken dönüşümü yapılmasının başlıca 3 amacı şunlardır:

  1. Doğrusal olmayan bir modeli doğrusallaştırmak için yapılabilir.
  2. Kurulan regresyon modelinin çeşitli varsayımların (sabit varyans, normallik) ihlal edilmesi durumunda varsayımları gerçekleyebilmek için yapılabilir.
  3. Değişkenler arasındaki doğrusal ilişkinin kuvvetlendirilmesine yönelik dönüşüm yapılabilir.

Doğrusal olmayan bir modeli doğrusal hale getirmek için genel olarak logaritmik dönüşüm uygulanır. Modelin her iki tarafının logaritması alınarak model doğrusal hale gelebilir. Bazı durumda modelin her iki tarafının çarpmaya göre tersi alınarak doğrusallık sağlanabilir. Bu tip modeller, Draper ve Smith’ e (1982) göre içsel doğrusal modeller olarak adlandırılır. Diğer yazarlar, bu tip modelleri dönüştürülebilen doğrusal modeller olarak ifade etmişlerdir.

Değişken dönüşümü, modelin tahmin gücünü artırmak üzere de yapılabilir. Yapılacak dönüşümler bağımlı ve bağımsız değişkene göre farklılık göstermektedir. Bağımsız değişken için öncelikle belirlenmesi gereken, dönüşümün gerekli olup olmadığına karar vermektir. Dönüştürülmüş ve mevcut X değişkenleri kullanılarak iki farklı model karşılaştırılarak bu kararı verebilmemiz mümkündür. Eğer dönüştürülmüş X değişkeni ile kurulan regresyon modelinin R2 değeri artış gösteriyorsa, dönüşüm yapılabilir. Ancak, mevcut X değişkeni ile kurulan modelin R2 değeri oldukça yüksekse, dönüşüme gerek yoktur. Belki dönüşüm yapıldığında R2 değeri artacaktır, ancak bu artış ile sağlanan kazanç, dönüşen değişkenin ölçü birimini kaybetmesi sebebiyle ortaya çıkan kaybı karşılayacak düzeyde değildir.

Mostteller ve Tukey (1977), dönüşen ve mevcut X değişkenleri arasındaki korelasyonu kullanarak bir ölçüt önermişlerdir. (R2)', mevcut değişken ile dönüşen değişkenin korelasyonun karesi olarak gösterilsin. [ 1-(R2)' ]/[ 1-(R2) ] değeri küçük bir ondalık değer alması durumunda dönüşümün yapılması gerektiği söylenebilir. Ayrıca X değişkenine ait değerlerin aralığına bakılarak dönüşüm yapılıp yapılmayacağına karar verilebilir. Herhangi sayıda gözlem için en büyük gözlemin en küçük gözleme oranı 3’ten küçükse,genel olarak mevcut ve dönüştürülmüş X değerleri arasında yüksek oranda korelasyon gözlenecektir. Bu durumda değişken dönüşümü yapılması bir anlam ifade etmemektedir. Sonuç olarak Mostteller ve Tukey’in incelemelerine bakarsak, değişken dönüşümünün kilit noktasının mevcut ve dönüşen değişkenler arasındaki korelasyon olduğu görülecektir. Eğer bu korelasyon yeterince 0,90 ve üzeri ise, değişken dönüşümüne gerek olmayacaktır.

Bağımsız değişken dönüşümü için genel olarak logaritma, karekök alma, ters alma gibi dönüşümler uygulanır. Box ve Tidwell (1962), bu tarz işlemler için matematiksel uygulamalar sonucunda yeni bir yöntem önermişlerdir. Bu yöntemin esası, Taylor serisi açılımı ve zincir türevi kuralına dayanmaktadır. Doğrusal regresyon modeli Taylor seri açılımı ile genişletilir ve zincir türevi kuralı ile yen bir regresyon modeli elde edilir. Yeni oluşturulan bu model ile mevcut modelden elde edilen parametrelerden yararlanılarak bir a değeri hesaplanır. Bu değer 0’a eşit ise In(X), 0’dan farklı ise Xa dönüşümü uygulanır. Bu yöntem, iteratif bir şekilde uygulanır ve a değeri belirli sayıda iterasyon sonucunda bir sayısal değere yakınsadığında hangi dönüşümün kullanılacağına karar verilir. Box-Tidwell dönüşümü, modelin eğim katsayısının standart hatası yeterince küçük olduğu zaman, dönüşüm etkin sonuç vermektedir.
           
     Bağımlı değişken dönüşümü, bağımsız değişken dönüşümüne göre farklılık göstermektedir.  Çünkü Y değişkeninin dönüşümü esnasında riskli durumlar söz konusu olabilir. Farz edelim ki, elimizde mevcut değişkenlerle kurulmuş bir regresyon modeli bulunsun ve bu model genel regresyon varsayımlarını (normallik, sabit varyans) sağlasın. Y değişkeni dönüştürüldüğünde, hata terimi doğrudan etkileneceği için bu varsayımların bozulma olasılığı son derece yüksektir. Özellikle Y değişkenine doğrusal olmayan bir dönüşüm uygularsak ve dönüşen değişken ile mevcut değişken arasında anlamlı bir korelasyon varsa, büyük olasılıkla dönüştürülmüş Y değişkeni normal dağılıma uymayacaktır ve hata terimlerine ilişkin normallik varsayımı bozulacaktır.

     Varsayımların bozulması durumunda Carrol ve Ruppert (1988) “her iki tarafın dönüştürme” (Transform Both Sides, TBS) yaklaşımını önermektedir. Bu yaklaşım, Box-Tidwell dönüşümüne benzer bir şekilde uygulanmaktadır. Ruppert ve Aldershof (1989) varsayımları gerçekleyebilmek için çeşitli teknikler önermektedir. Bu teknikler üç ayrı tahminci kurmak üzere şekillendirilmiştir. İlk olarak hata terimleri için simetrik bir dağılım elde etmektir. Bu şekilde normallik varsayımı yeniden sağlanacaktır. İkinci yaklaşım değişen varyansı ortadan kaldırmak üzere bir tahminci üretmektir. Üçüncüsü de hem normal dağılım, hem sabit varyans varsayımını gerçekleyecek bir tahminci üretmektir.