Tidakkah Anda melakukan transformasi logit untuk membuat variabel mulai dari minus hingga tak terhingga? Saya tidak yakin apakah data yang memiliki 0 dan 1 seharusnya menjadi masalah. Apakah itu menunjukkan pesan kesalahan? Omong-omong, jika Anda hanya memiliki proporsi, analisis Anda akan selalu salah. Anda perlu menggunakan weight=argument
untuk glm
dengan jumlah kasus.
Jika tidak ada yang berhasil, Anda dapat menggunakan split median atau split kuartil atau titik potong apa pun yang menurut Anda tepat untuk membagi DV menjadi beberapa kategori dan kemudian menjalankan regresi logistik Ordinal. Itu mungkin berhasil. Cobalah hal-hal ini.
Saya tidak berpikir secara pribadi bahwa menambahkan 0,001 ke nol dan mengambil 0,001 dari yang merupakan ide yang terlalu buruk, tetapi memiliki beberapa masalah yang akan dibahas nanti. Bayangkan saja, mengapa Anda tidak menambahkan dan mengurangi 0,000000001 (atau bahkan lebih banyak desimal)? Itu akan lebih baik mewakili 0 dan 1 !! Bagi Anda mungkin hal itu tidak membuat banyak perbedaan. Tetapi sebenarnya itu terjadi.
Mari kita simak yang berikut ini:
> #odds when 0 is replaced by 0.00000001
> 0.00000001/(1-0.00000001)
[1] 1e-08
> log(0.00000001/(1-0.00000001))
[1] -18.42068
> #odds when 1 is replaced by (1-0.00000001):
> (1-0.00000001)/(1-(1-0.00000001))
[1] 1e+08
> log((1-0.00000001)/(1-(1-0.00000001)))
[1] 18.42068
> #odds when 0 is replaced by 0.001
> 0.001/(1-0.001)
[1] 0.001001001
> log(0.001/(1-0.001))
[1] -6.906755
> #odds when 1 is replaced by (1-0.001):
> (1-0.001)/(1-(1-0.001))
[1] 999
> log((1-0.001)/(1-(1-0.001)))
[1] 6.906755
Jadi, Anda tahu, Anda harus menjaga peluang sedekat (0/1) dan (1/0). Anda mengharapkan peluang log mulai dari minus tak terhingga hingga plus tak terhingga. Jadi, untuk menambah atau mengurangi, Anda harus memilih hingga tempat desimal yang sangat panjang, sehingga peluang log menjadi mendekati tak terhingga (atau sangat besar) !! Sejauh mana Anda akan mempertimbangkan cukup besar, semata-mata tergantung pada Anda.