x+x2+…
Nilainya? —Baik, ini cara cepat & mudah untuk memperhitungkan kelengkungan tanpa harus memikirkannya, & modelnya mungkin cukup baik untuk apa Anda menggunakannya. Itu cenderung berfungsi dengan baik ketika Anda memiliki banyak data dibandingkan dengan jumlah prediktor, setiap prediktor dipecah menjadi banyak kategori; dalam hal ini dalam setiap pita prediktor rentang respons kecil & rata-rata respons ditentukan dengan tepat.
[Edit dalam menanggapi komentar:
Kadang-kadang ada batas standar yang digunakan dalam suatu bidang untuk variabel kontinu: misalnya dalam kedokteran, pengukuran tekanan darah dapat dikategorikan sebagai rendah, sedang atau tinggi. Mungkin ada banyak alasan bagus untuk menggunakan cut-off seperti itu saat Anda mempresentasikan atau menerapkan model. Secara khusus, aturan keputusan seringkali didasarkan pada informasi yang lebih sedikit daripada yang dimasukkan ke dalam model, & mungkin perlu sederhana untuk diterapkan. Tapi itu tidak berarti bahwa cut-off ini tepat untuk membuang prediktor ketika Anda cocok dengan model.
Misalkan beberapa respons bervariasi secara terus menerus dengan tekanan darah. Jika Anda mendefinisikan kelompok tekanan darah tinggi sebagai prediktor dalam penelitian Anda, efek yang Anda perkirakan adalah respons rata-rata terhadap tekanan darah tertentu dari individu dalam kelompok itu. Ini tidakperkiraan tanggapan rata-rata orang dengan tekanan darah tinggi pada populasi umum, atau orang-orang dalam kelompok tekanan darah tinggi dalam studi lain, kecuali jika Anda mengambil langkah-langkah khusus untuk melakukannya. Jika distribusi tekanan darah pada populasi umum diketahui, seperti yang saya bayangkan, Anda sebaiknya menghitung rata-rata respon orang dengan tekanan darah tinggi pada populasi umum berdasarkan prediksi dari model dengan tekanan darah sebagai variabel kontinu. Binning kasar membuat model Anda hanya bisa digeneralisasikan.
Secara umum, jika Anda memiliki pertanyaan tentang perilaku respons antara cut-off, pas dengan model terbaik yang Anda bisa, & kemudian gunakan untuk menjawabnya.]
[Berkenaan dengan presentasi; Saya pikir ini adalah herring merah:
(1) Kemudahan presentasi tidak membenarkan keputusan pemodelan yang buruk. (Dan dalam kasus di mana binning adalah keputusan pemodelan yang baik, itu tidak perlu pembenaran tambahan.) Tentunya ini jelas. Tidak ada yang pernah merekomendasikan mengeluarkan interaksi penting dari model karena sulit untuk disajikan.
(2) Apa pun jenis model yang Anda cocok, Anda masih dapat menyajikan hasilnya dalam hal kategori jika Anda pikir itu akan membantu interpretasi. Meskipun ...
(3) Anda harus berhati-hati untuk memastikan itu tidak membantu salah tafsir, karena alasan yang diberikan di atas.
(4) Sebenarnya tidak sulit untuk menyajikan respons non-linear. Pendapat pribadi, jelas, & khalayak berbeda; tapi saya belum pernah melihat grafik nilai respons yang dipasang versus nilai prediktor teka-teki seseorang hanya karena melengkung. Interaksi, logit, efek acak, multikolinieritas, ...— semua ini jauh lebih sulit untuk dijelaskan.]
[Poin tambahan yang dibawa oleh @Roland adalah ketepatan pengukuran prediktor; dia menyarankan, saya pikir, bahwa kategorisasi mungkin tepat ketika mereka tidak terlalu tepat. Akal sehat mungkin menyarankan agar Anda tidak memperbaiki masalah dengan menyatakannya kembali dengan kurang tepat, & akal sehat akan benar: MacCallum et al (2002), "Tentang Praktik Dikotomisasi Variabel Kuantitatif", Metode Psikologis , 7 , 1, hlm. 17–19.]