Peluang adalah cara untuk mengekspresikan peluang. Rasio peluang hanya itu: satu peluang dibagi dengan yang lain. Itu berarti rasio odds adalah apa yang Anda kalikan satu peluang dengan menghasilkan yang lain. Mari kita lihat bagaimana mereka bekerja dalam situasi bersama ini.
Konversi antara peluang dan probabilitas
Peluang dari respons biner adalah rasio dari kemungkinan terjadinya (dikodekan dengan 1 ), ditulis Pr ( Y =Y1 , dengan peluang tidak (dikodekan dengan 0 ), dituliskan Pr ( Y = 0 ) :Pr ( Y= 1 )0Pr ( Y= 0 )
Peluang ( Y) = Pr ( Y= 1 )Pr ( Y= 0 )= Pr ( Y= 1 )1 - Pr ( Y= 1 ).
Ekspresi ekuivalen di sebelah kanan menunjukkan cukup untuk memodelkan untuk menemukan peluang. Sebaliknya, perhatikan bahwa kita dapat menyelesaikannyaPr ( Y= 1 )
Pr ( Y= 1 ) = Peluang ( Y)1+Odds(Y)=1−11+Odds(Y).
Regresi logistik
Regresi logistik memodelkan logaritma peluang sebagai fungsi linear dari variabel penjelas. Paling umum, menulis variabel-variabel ini sebagai x 1 , ... , x p , dan termasuk kemungkinan istilah konstan dalam fungsi linier, kita dapat menamai koefisien (yang diperkirakan dari data) sebagai β 1 , ...Yx1,…,xp dan β 0 . Secara formal ini menghasilkan modelβ1,…,βpβ0
catatan( Peluang ( Y) ) = β0+ β1x1+ ⋯ + βhalxhal.
Peluang itu sendiri dapat dipulihkan dengan membatalkan logaritma:
Peluang ( Y) = exp( β0+ β1x1+ ⋯ + βhalxhal) .
Menggunakan variabel kategori
Variabel kategorikal, seperti kelompok umur, jenis kelamin, keberadaan Glaukoma, dll. , Digabungkan dengan menggunakan "dummy coding." Untuk menunjukkan bahwa bagaimana variabel dikodekan tidak masalah, saya akan memberikan contoh sederhana dari satu kelompok kecil; generalisasi ke banyak kelompok harus jelas. Dalam penelitian ini satu variabel adalah "ukuran murid," dengan tiga kategori, "Besar", "Sedang", dan "Kecil". (Studi ini memperlakukan ini sebagai murni kategori, tampaknya tidak memperhatikan urutan bawaannya.) Secara intuitif, setiap kategori memiliki peluangnya sendiri, katakan untuk "Besar", α M untuk "Sedang", dan α S untuk "Kecil" . Ini berarti bahwa, semua hal lain sama,αL.αM.αS
Peluang ( Y) = exp( αL.+ β0+ β1x1+ ⋯ + βhalxhal)
untuk siapa saja di kategori "Besar",
Odds(Y)=exp(αM+β0+β1x1+⋯+βpxp)
untuk siapa saja dalam kategori "Sedang", dan
Odds(Y)=exp(αS+β0+β1x1+⋯+βpxp)
untuk mereka yang berada di kategori "Kecil".
Membuat koefisien yang dapat diidentifikasi
Saya telah mewarnai dua koefisien pertama untuk menyorotnya, karena saya ingin Anda memperhatikan bahwa mereka memungkinkan perubahan sederhana terjadi: kita dapat memilih angka dan, dengan menambahkannya ke β 0 dan mengurangkannya dari masing-masing α L , α M , dan α S , kami tidak akan mengubah peluang prediksi. Ini karena persamaan bentuk yang jelasγβ0αLαMαS
αL+β0=(αL−γ)+(γ+β0),
dll. Meskipun ini tidak menimbulkan masalah untuk model - masih memprediksi hal yang persis sama - ini menunjukkan bahwa parameter tidak dapat ditafsirkan dengan sendirinya. Apa yang tetap sama ketika kita melakukan manuver penjumlahan-pengurangan ini adalah perbedaan antara koefisien. Secara konvensional, untuk mengatasi kurangnya pengidentifikasian ini, orang-orang (dan secara default, perangkat lunak) memilih salah satu kategori dalam setiap variabel sebagai "basis" atau "referensi" dan hanya menetapkan bahwa koefisiennya akan nol. Ini menghilangkan ambiguitas.
αLαL,αM,αSβ0
Peluang log untuk individu hipotetis jatuh ke semua kategori dasar karena itu sama β0
Odds(Base category)=exp(β0+β1X1+⋯+βpXp).
βiαj
Membandingkan peluang
Mari kita bandingkan peluang. Misalkan individu hipotetis adalah a
pasien laki-laki berusia 80-89 tahun dengan katarak putih, tanpa pandangan fundus, dan seorang murid kecil yang dioperasi oleh petugas khusus, ...
α80-89αmale
α80-89+αmale+αno Glaucoma+⋯+αspecialist registrar.
Ini adalah jumlah dimana log odds pasien ini bervariasi dari basis. Untuk mengonversi dari peluang log, batalkan logaritma dan ingat bahwa ini mengubah penambahan menjadi multiplikasi. Oleh karena itu, peluang dasar harus dikalikan dengan
exp(α80-89)exp(αmale)exp(αno Glaucoma)⋯exp(αspecialist registrar).
x1,…,xpexp(α80-89)=1.58exp(αmale)=1.28exp(αno Glaucoma)=1.0034.5
Odds(Charlie)=34.5×Odds(Base).
1.00=exp(0)1 dalam produk tidak berubah. Itulah cara Anda dapat menemukan kategori dasar dalam tabel.)
Mengembalikan hasil sebagai probabilitas
0.736%=0.00736
Odds(Base)=0.007361−0.00736=0.00741.
Akibatnya peluang Charlie adalah
Odds(Charlie)=34.5×0.00741=0.256.
Finally, converting this back to probabilities gives
Pr(Y(Charlie)=1)=1−11+0.256=0.204.