Kadang-kadang saya melihat dalam literatur bahwa variabel kategori seperti seks adalah "partialled" atau "regressed" dalam analisis regresi (efek tetap atau efek campuran). Saya bermasalah dengan masalah-masalah praktis berikut yang terlibat dalam pernyataan seperti itu:
(1) Biasanya metode pengkodean tidak disebutkan dalam makalah. Variabel seperti itu harus dikodekan dengan nilai-nilai kuantitatif, dan saya merasa cara yang masuk akal harus efek pengkodean (misalnya, laki-laki = 1, perempuan = -1) sehingga partialling dapat dicapai dengan efek lain yang ditafsirkan dengan rata-rata besar dari kedua jenis kelamin kelompok. Pengkodean yang berbeda dapat menghasilkan interpretasi yang berbeda (dan tidak diinginkan). Misalnya, pengkodean dummy (misalnya, laki-laki = 0, perempuan = 1) akan meninggalkan efek lain yang terkait dengan laki-laki, bukan mean besar. Bahkan memusatkan variabel dummy-kode ini mungkin tidak berfungsi dengan baik untuk tujuan partialling mereka jika ada jumlah subjek yang tidak sama di kedua kelompok. Apakah saya benar?
(2) Jika pengaruh variabel kategorikal tersebut dimasukkan dalam model, memeriksa efeknya terlebih dahulu tampaknya perlu dan harus dibahas dalam konteks karena konsekuensinya pada interpretasi efek lain. Yang mengganggu saya adalah bahwa kadang-kadang penulis bahkan tidak menyebutkan pentingnya efek seks, apalagi proses pembangunan model. Jika efek seks ada, pertanyaan tindak lanjut alami adalah apakah ada interaksi antara jenis kelamin dan variabel lain dalam model? Jika tidak ada efek seks dan tidak ada interaksi, seks harus dihapus dari model.
(3) Jika seks dianggap tidak menarik bagi para penulis, apa gunanya memasukkannya ke dalam model sejak awal tanpa memeriksa efeknya? Apakah dimasukkannya variabel kategori semacam itu (dan menghabiskan satu derajat kebebasan pada efek tetap dari seks) mendapatkan sesuatu untuk tujuan partialling mereka ketika efek seks ada (pengalaman terbatas saya mengatakan pada dasarnya tidak)?