Bias penduga kemungkinan maksimum untuk regresi logistik


10

Saya ingin memahami beberapa fakta tentang estimator kemungkinan maksimum (MLE) untuk regresi logistik.

  1. Apakah benar bahwa, secara umum, MLE untuk regresi logistik bias? Saya akan mengatakan "ya". Saya tahu, misalnya, bahwa dimensi sampel terkait dengan bias asimptotik MLEs.

    Apakah Anda tahu ada contoh dasar dari fenomena ini?

  2. Jika MLE bias, apakah benar bahwa matriks kovarians MLE adalah kebalikan dari Hessian dari fungsi kemungkinan maksimum?

    sunting : Saya sudah sering bertemu formula ini dan tanpa bukti; tampaknya pilihan yang cukup sewenang-wenang bagi saya.

Jawaban:


15

Pertimbangkan model regresi logistik biner sederhana, dengan variabel dependen biner dan hanya dan konstanta biner yang konstan . mana adalah cdf logistik, .TΛ Λ ( u ) = [ 1 + exp { - u } ] - 1

Pr(Ysaya=1Tsaya=1)=Λ(α+βTsaya)
ΛΛ(kamu)=[1+exp{-kamu}]-1

Dalam formulir logit, kita memiliki

dalam(Pr(Ysaya=1Tsaya=1)1-Pr(Ysaya=1Tsaya=1))=α+βTsaya

Anda memiliki sampel ukuran . Mendenotasikan jumlah observasi di mana dan mereka di mana , dan . Pertimbangkan perkiraan probabilitas kondisional berikut:n 1 T i = 1 n 0 T i = 0 n 1 + n 0 = nnn1Tsaya=1n0Tsaya=0n1+n0=n

Pr^(Y=1T=1)P^1|1=1n1Tsaya=1ysaya

Pr^(Y=1T=0)P^1|0=1n0Tsaya=0ysaya

Maka model yang sangat mendasar ini menyediakan solusi bentuk tertutup untuk penaksir ML:

α^=dalam(P^1|01-P^1|0),β^=dalam(P^1|11-P^1|1)-dalam(P^1|01-P^1|0)

BIAS

Meskipun dan adalah penaksir yang tidak bias dari probabilitas yang sesuai, MLEs bias, karena fungsi logaritmik non-linier menghalangi - membayangkan apa yang terjadi pada model yang lebih rumit , dengan tingkat non-linearitas yang lebih tinggi.P^1|1P^1|0

Tapi tanpa gejala, bias menghilang karena estimasi probabilitas konsisten. Memasukkan langsung operator di dalam nilai yang diharapkan dan logaritma, kami memiliki lim

limnE[α^]=E[dalam(limnP^1|01-P^1|0)]=E[dalam(P1|01-P1|0)]=α

dan juga untuk . β

MATRIKS VARIANCE-COVARIANCE MLE
Dalam kasus sederhana di atas yang memberikan ekspresi bentuk tertutup untuk estimator, seseorang dapat, setidaknya pada prinsipnya, melanjutkan dan mendapatkan distribusi sampel hingga yang tepat dan kemudian menghitung sampel sampel varians-kovarians matriks yang tepat . Tetapi secara umum, MLE tidak memiliki solusi bentuk tertutup. Kemudian kami menggunakan estimasi yang konsisten dari matriks varians-kovarians asimptotik, yang memang (negatif dari) kebalikan dari Goni dari fungsi log-likelihood sampel, dievaluasi di MLE. Dan tidak ada "pilihan sewenang-wenang" di sini sama sekali, tetapi ini dihasilkan dari teori asimptotik dan sifat asimptotik dari MLE (konsistensi dan normalitas asimptotik), yang memberi tahu kita bahwa, untuk , θ0=(α,β)

n(θ^-θ0)dN(0,-(E[H])-1)

dimana adalah Hessian. Kira-kira dan untuk sampel terbatas (besar), ini membawa kita keH

Var(θ^)-1n(E[H])-1-1n(1nH^)-1=-H^-1
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.