İstatiksel Analiz

Lojistik Regresyon Tanımı ve Kullanımı

A-) Lojistik Regresyon

A.1-)Özet

İkili bir bağımlı değişkeni tahmin etmede birden fazla faktörden oluşan bir model oluşturulması ve lojistik regresyon analizi hakkında bilgi sahibi olması ve bu analizi SPSS ile yapabilmesi amaçlanmıştır.

Aşağıdaki adımları izleyerek lojistik regresyon hakkında detaylı bilgiler verilmeye çalışılmıştır.

• Lojistik regresyonun kullanım alanlarını açıklayabilmek

• Lojistik regresyon modeline konacak değişkenlerin nasıl seçileceğini açıklayabilmek

o Tek değişkenli model

o İkili karşılaştırmalar

• -2 log-likelihood’u açıklayabilmek

• Odds ratio nun lojistik regresyondaki yerini açıklayabilmek

• Lojistik regresyon modelinin bağımlı değişkeni tahmin etme sınıflandırma tablosunu yorumlayabilmek

• Lojistik regresyon modelinin duyarlılık (sensitivity), özgüllük (specifity) ve doğru sınıflandırma oranını açıklayabilmek

A.2-)Lojistik Regresyon Tanımı ve Kullanımı

Birden fazla değişkeni kullanrak ikili bir değişkenin (sigara içme durumu, baş ağrısı olma durumu gibi) durumunu tahmin etmek için (içiyor/içmiyor veya var/yok gibi) lojistik regresyon analizinden yararlanabiliriz.

Bağımlı değişkenimizin ikiden fazla kategori içermesi halinde (örn. çeşitli değişkenleri kullanarak diyabetik bireylerin ilaç tercihlerini tahmin etmeye çalışmak) multinomiyal lojistik regresyon analizini kullanabiliriz.

Bağımlı değişkenimizin numerik bir değişken olması halinde bireyin alacağı değeri tahmin etmek için (örn. diyabetik bireylerimizin kan şekerlerini tahmin etmek) lineer regresyon analizini kullanabiliriz.

Öncelikle bağımlı değişkenimizi 1 = var, 0 = yok şeklinde kodlamalıyız. Bunu yapmamız halinde SPSS’te otomatik olarak kategoriler 1 ve 0 olarak dönüştürüleceğinden yorumlama sırasında sorun yaşayabiliriz.

Bir bireyin incelenen duruma sahip olma olasılığına (örn. sigara içiyor) p diyelim. Regresyon eşitliğinde lojistik dönüşüm uygulanır. Olasılığın logit değeri e tabanına göre hastalığın odds oranının logaritmasıdır.

A.3-)Lojistik regresyon eşitliği

Lojistik regresyon eşitliği aşağıdaki formülle gösterilir:

• x = açıklayıcı değişken (cinsiyet, yaş gibi)

p, bireyin ilgili duruma sahip olma olasılığı

a, sabit katsayı

b1, b2… tahmin edilen lojistik regresyon katsayıları

İlgili tahmin ettirici değişkenin odds oranı  olarak hesaplanır. Hastalığın nadir olması halinde odds oranı relatif risk olarak ta değerlendirilebilir.

Eğer lojistik regresyon eşitliğinden hastalığın meydana gelme olasılığını tahmin etmek istersek;

buradan da;

formülünü kullanarak olasılığı hesaplayabiliriz.

 A.4-)Modelin oluşturulması:

İyi bir lojistik regresyon analizi için öncelikle sağlam bir model oluşturmalıyız. Yani, tahmin etmeye çalıştığımız bağımlı değişkenimiz etki edebilecek faktörleri iyi belirlemeliyiz. Bu işlemi klinik bilgimizi ve literatür verilerini kullanarak yapmalıyız. Modelimize çok fazla değişken koymak yerine az değişkenle daha kesin bir tahmin yapmayı tercih etmeliyiz. Diğer taraftan, örneklem sayımızın yeterli olmadığı durumlarda çok sayıda değişkeni modelimize eklememiz halinde analiz yapılamayacaktır.

A.5-)Modelin uygunluğunun test edilmesi:

-2 loglikelihood: ki kareye yakın bir dağılım gösterir ve anlamlı (yüksek) olması kötü bir tahmine işaret eder.

• R kare (R square): bağımlı değişkendeki değişimin ne kadarının modele konulan değişkenler tarafından belirlendiğini gösterir. Örn. 0,218 olması durumunda bağımlı değişkenin %21,8’inin modele konan değişkenler tarafından belirlendiği anlaşılır.

Sınıflandırma tablosu (classification table): bu tablo modelin incelenen durumu ne kadar doğru sınıflandırabildiğini gösterir. Buradan duyarlık (sensitivite), özgüllük (specifiy) ve genel sınıflandırma durumu hesaplanabilir.

Ne düşünüyorsun?