Nilai yang tidak berarti dari variabel bersarang tidak boleh memengaruhi model Anda: Desideratum
penting dengan jenis analisis data ini adalah bahwa nestedvariabel tersebut tidak boleh memengaruhi model jika explanatoryvariabel asli tidak mengakuinya sebagai variabel bermakna. Dengan kata lain, model harus berupa bentuk yang mengabaikan nilai yang tidak berarti dari variabel bersarang . Ini adalah persyaratan penting untuk model yang valid dengan variabel bersarang, karena memastikan bahwa output model tidak terpengaruh oleh pilihan pengkodean sewenang-wenang.
Pemodelan dengan variabel bersarang: Persyaratan ini dicapai dengan menempatkan nestedvariabel ke dalam model hanya sebagai interaksi dengan explanatoryvariabel asli , tanpa memasukkannya sebagai efek utama. (Lebih khusus, variabel bertingkat harus berinteraksi dengan pernyataan logis pada variabel penjelas yang menunjukkan bahwa itu adalah variabel yang bermakna.) Perhatikan bahwa ini merupakan pengecualian terhadap aturan umum bahwa istilah tidak boleh dimasukkan sebagai interaksi tanpa istilah efek utama .
Pertimbangkan kasus umum di mana nestedvariabel hanya bermakna ketika explanatoryvariabel dalam beberapa set nilai A. Dalam hal ini, Anda akan menggunakan formulir model seperti ini:
response ~ 1 + explanatory + (explanatory %in% A):nested + ...
Dalam kasus umum di mana explanatoryvariabel Anda adalah variabel indikator (dengan nilai satu menimbulkan variabel bersarang bermakna), bentuk model ini menyederhanakan ini:
response ~ 1 + explanatory + explanatory:nested + ...
Perhatikan bahwa dalam pernyataan model ini tidak ada istilah efek utama untuk nestedvariabel. Ini dengan desain --- variabel bertingkat seharusnya tidak memiliki istilah efek utama, karena itu bukan variabel yang berarti tanpa adanya kondisi pada variabel penjelas. Dengan bentuk model seperti ini, Anda akan mendapatkan perkiraan untuk pengaruh variabel penjelas dan perkiraan lain untuk pengaruh variabel bersarang.
Mengkode variabel bersarang dalam data Anda: Ketika berhadapan dengan frame data yang mencantumkan variabel untuk regresi, praktik yang baik untuk nilai-nilai nestedvariabel yang akan dikodekan seperti NAdalam kasus-kasus di mana ia tidak bermakna muncul dari variabel penjelas. Ini memberitahu pembaca bahwa tidak ada variabel yang berarti di sini. Beberapa analis mengkode variabel-variabel ini dengan nilai-nilai lain, seperti nol, tetapi itu umumnya merupakan praktik buruk, karena dapat disalahartikan sebagai kuantitas yang bermakna.
Secara matematis, jika Anda mengalikan bilangan real dengan nol, Anda mendapatkan nol. Namun, jika Anda coding di RAnda harus berhati-hati di sini karena mengalikan Program 0:NAuntuk memberikan NAbukannya 0. Ini berarti bahwa Anda mungkin perlu mengkode ulang NAnilai - nilai ke nol untuk keperluan pemasangan model, atau membangun matriks desain untuk model sehingga nilai-nilai ini diatur ke nol.
Kasus di mana variabel dasar adalah fungsi dari variabel bersarang: Satu situasi yang kadang-kadang muncul dalam analisis regresi yang melibatkan variabel bersarang adalah kasus di mana variabel bersarang memiliki jumlah detail yang cukup sehingga sepenuhnya menentukan variabel penjelas awal yang muncul dari - - Yaitu, variabel penjelas asli adalah fungsi dari variabel bersarang. Contoh dari ini terjadi dalam pertanyaan ini , di mana analis memiliki variabel indikator DrugAuntuk apakah obat telah diambil, dan variabel bersarang DrugA_Concuntuk konsentrasi obat. Dalam contoh ini, variabel terakhir memungkinkan nilai konsentrasi nol, yang setara dengan obat yang tidak diminum, dan DrugAjuga setara dengan DrugA_Conc != 0.
Dalam jenis kasus ini, istilah interaksi antara variabel penjelas dan variabel bersarang secara fungsional setara dengan variabel bersarang, dan dengan demikian dimungkinkan (dan biasanya diinginkan) untuk menghapus variabel penjelas awal dari model secara keseluruhan, dan cukup menggunakan variabel bersarang sendiri. Ini sah dalam hal ini, karena nilai-nilai dalam variabel bersarang menentukan nilai variabel penjelas awal. Kami telah mencatat di atas bahwa sering kali tepat untuk membuat kode variabel bertingkat NAketika kondisi mereka tidak berlaku. Jika kondisi muncul dari variabel penjelas yang merupakan indikator, dan indikator tersebut sesuai dengan penggunaan variabel bersarang, maka kejadian nested != NAtersebut setara denganexplanatory. Dalam kasus seperti itu, dimungkinkan untuk mengkode ulang variabel bersarang sehingga variabel penjelas awal tidak diperlukan dalam model sama sekali.
Perhatikan bahwa perhatian harus diberikan ketika melihat situasi ini. Bahkan dalam kasus di mana Anda menggunakan variabel penjelas awal yang merupakan variabel indikator, mungkin berguna untuk tujuan interpretatif untuk tidak menggabungkan variabel penjelas dan variabel bertingkat. Selain itu, dalam kasus di mana variabel penjelas bukan merupakan variabel indikator, biasanya akan berisi informasi yang tidak terkandung dalam variabel bersarang, sehingga tidak dapat dihapus.