Secara teori, skala input Anda tidak relevan dengan regresi logistik. Anda dapat "secara teoritis" mengalikan dengan dan perkiraan untuk akan menyesuaikan. Itu akan menjadi kali lebih kecil dari yang asli , karena properti invarian dari MLEs.X110101010β110−101010β1
Tetapi cobalah membuat R untuk melakukan regresi yang disesuaikan di atas - itu akan membuat takut (bahkan tidak akan dapat membangun matriks X).
Ini sedikit seperti algoritma dekomposisi cholesky untuk menghitung akar kuadrat matriks. Ya, dalam matematika yang tepat , dekomposisi cholesky tidak pernah melibatkan mengambil akar kuadrat dari angka negatif, tetapi melengkapi kesalahan, dan aritmatika floating point dapat menyebabkan kasus-kasus seperti itu.
Anda dapat mengambil setiap kombinasi linear dari variabel X, dan nilai-nilai diprediksi akan sama.
Jika kita menerima saran @ simone, dan menggunakan variabel X yang diskalakan ulang untuk menyesuaikan model . Tetapi kita dapat menggunakan properti invarian dari MLE untuk mendapatkan beta yang kita inginkan, setelah menggunakan variabel input X yang stabil secara numerik. Mungkin saja beta pada skala asli mungkin lebih mudah diinterpretasikan daripada beta pada transformasi @ simone. Jadi, kita memiliki telah ditransformasi ( observasi ke- untuk variabel ), sebut saja , yang didefinisikan oleh:xijijx~ij
x~ij=ajxij+bj
Pilihan @ simone sesuai dengan dan (menggunakan untuk menunjukkan statistik urutan ke- dari variabel , yaitu ). The dan dapat dianggap sebagai parameter algoritma (dipilih untuk membuat algoritma lebih stabil dan / atau berjalan lebih cepat). Kami kemudian memasukkan regresi logistik menggunakan , dan mendapatkan taksiran parameter . Jadi kita menulis prediktor linier:aj=1x[N]j−x[1]jbj=x¯¯¯jx[N]j−x[1]jx[i]jijx[N]j≥x[N−1]j≥⋯≥x[1]jajbjx~ijβ~j
zi=β~0+∑jx~ijβ~j
Sekarang gantikan persamaan untuk dan Anda mendapatkan:x~ij
zi=β~0+∑j(ajxij+bj)β~j=β0+∑jxijβj
Di mana
β0=β~0+∑jbjβ~jβj=ajβ~j
Anda dapat melihat bahwa secara teoritis, parameter tidak membuat perbedaan sama sekali: pilihan apa pun (selain dari ) akan mengarah pada kemungkinan yang sama, karena prediktor linier tidak berubah. Ia bahkan bekerja untuk transformasi linier yang lebih rumit, seperti merepresentasikan matriks X dengan komponen utamanya (yang melibatkan rotasi). Jadi kita dapat mengubah hasil untuk mendapatkan beta yang kita inginkan untuk interpretasi.aj,bjaj=0