Ini mungkin bukan hal yang baik untuk dilakukan. Melihat semua kovariat individu terlebih dahulu, dan kemudian membangun model dengan yang signifikan secara logika setara dengan prosedur pencarian otomatis. Walaupun pendekatan ini intuitif, kesimpulan yang dibuat dari prosedur ini tidak valid (misalnya, nilai-p sebenarnya berbeda dari yang dilaporkan oleh perangkat lunak). Masalahnya diperbesar semakin besar ukuran set awal kovariat. Jika Anda tetap melakukan ini (dan, sayangnya, banyak orang melakukannya), Anda tidak dapat menganggap serius model yang dihasilkan. Sebagai gantinya, Anda harus menjalankan studi yang sama sekali baru, mengumpulkan sampel independen dan menyesuaikan model sebelumnya, untuk mengujinya. Namun, ini membutuhkan banyak sumber daya, dan terlebih lagi, karena prosesnya cacat dan model sebelumnya kemungkinan yang buruk,buang banyak sumber daya.
Cara yang lebih baik adalah mengevaluasi model-model yang menarik bagi Anda. Kemudian gunakan kriteria informasi yang menghukum fleksibilitas model (seperti AIC) untuk diputuskan di antara model-model tersebut. Untuk regresi logistik, AIC adalah:
AIC=−2×ln(likelihood)+2k
di mana adalah jumlah kovariat yang termasuk dalam model itu. Anda ingin model dengan nilai terkecil untuk AIC, semua hal dianggap sama. Namun, itu tidak selalu begitu sederhana; waspada ketika beberapa model memiliki nilai yang sama untuk AIC, meskipun satu mungkin paling rendah. k
Saya memasukkan formula lengkap untuk AIC di sini, karena perangkat lunak yang berbeda menghasilkan informasi yang berbeda. Anda mungkin harus menghitungnya hanya dari kemungkinan, atau Anda bisa mendapatkan AIC akhir, atau apa pun di antaranya.