Dalam model tanpa istilah interaksi (yaitu, tanpa istilah yang dikonstruksi sebagai produk dari istilah lain), koefisien regresi masing-masing variabel adalah kemiringan permukaan regresi ke arah variabel itu. Itu konstan, terlepas dari nilai-nilai variabel, dan karena itu dapat dikatakan untuk mengukur efek keseluruhan dari variabel itu.
Dalam model dengan interaksi, interpretasi ini dapat dibuat tanpa kualifikasi lebih lanjut hanya untuk variabel-variabel yang tidak terlibat dalam interaksi apa pun. Untuk variabel yang terlibat dalam interaksi, koefisien regresi "efek utama" - yaitu, koefisien regresi variabel dengan sendirinya - adalah kemiringan permukaan regresi ke arah variabel itu ketika semua variabel lain yang berinteraksi dengan variabel yang memiliki nilai nol , dan uji signifikansi koefisien mengacu pada kemiringan permukaan regresi hanya di wilayah ruang prediktor. Karena tidak ada persyaratan bahwa sebenarnya ada data di wilayah ruang tersebut, koefisien efek utama mungkin memiliki sedikit kemiripan dengan kemiringan permukaan regresi di wilayah ruang prediktor tempat data sebenarnya diamati.
Dalam istilah anova, koefisien efek utama analog dengan efek utama sederhana, bukan efek utama keseluruhan. Selain itu, itu mungkin merujuk pada apa yang dalam desain anova akan menjadi sel kosong di mana data dipasok dengan mengekstrapolasi dari sel dengan data.
Untuk mengukur efek keseluruhan variabel yang analog dengan efek utama keseluruhan dalam anova dan tidak mengekstrapolasi di luar wilayah tempat data diamati, kita harus melihat kemiringan rata-rata permukaan regresi ke arah variabel. , di mana rata-rata lebih dari N kasus yang benar-benar diamati. Kemiringan rata-rata ini dapat dinyatakan sebagai jumlah bobot dari koefisien regresi dari semua istilah dalam model yang melibatkan variabel yang dipermasalahkan.
Bobotnya canggung untuk digambarkan tetapi mudah didapat. Koefisien efek-utama variabel selalu mendapat bobot 1. Untuk setiap koefisien lain dari istilah yang melibatkan variabel itu, bobot adalah rata-rata produk dari variabel-variabel lain dalam istilah itu. Misalnya, jika kita memiliki lima variabel "mentah" x1, x2, x3, x4, x5
, ditambah empat interaksi dua arah (x1,x2), (x1,x3), (x2,x3), (x4,x5)
, dan satu interaksi tiga arah (x1,x2,x3)
, maka modelnya adalah
y = b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4 + b5*x5 +
b12*x1*x2 + b13*x1*x3 + b23*x2*x3 + b45*x4*x5 +
b123*x1*x2*x3 + e
dan keseluruhan efek utamanya adalah
B1 = b1 + b12*M[x2] + b13*M[x3] + b123*M[x2*x3],
B2 = b2 + b12*M[x1] + b23*M[x3] + b123*M[x1*x3],
B3 = b3 + b13*M[x1] + b23*M[x2] + b123*M[x1*x2],
B4 = b4 + b45*M[x5],
B5 = b5 + b45*M[x4],
di mana M [.] menunjukkan rata-rata sampel dari jumlah di dalam kurung. Semua istilah produk di dalam tanda kurung adalah di antara yang dibuat untuk melakukan regresi, sehingga program regresi harus sudah tahu tentang mereka dan harus dapat mencetak sarana mereka berdasarkan permintaan.
Dalam model yang hanya memiliki efek utama dan interaksi dua arah, ada cara yang lebih sederhana untuk mendapatkan efek keseluruhan: pusatkan [1] variabel mentah di tempatnya. Ini harus dilakukan sebelum menghitung persyaratan produk, dan tidak dilakukan pada produk. Kemudian semua ekspresi M [.] Akan menjadi 0, dan koefisien regresi akan ditafsirkan sebagai efek keseluruhan. Nilai-nilai b akan berubah; nilai-nilai B tidak akan. Hanya variabel yang terlibat dalam interaksi yang perlu dipusatkan, tetapi biasanya tidak ada salahnya memusatkan variabel yang diukur lainnya. Efek umum dari pemusatan suatu variabel adalah bahwa, selain mengubah intersep, hanya mengubah koefisien variabel lain yang berinteraksi dengan variabel terpusat. Khususnya, itu tidak mengubah koefisien dari istilah apa pun yang melibatkan variabel terpusat. Dalam contoh yang diberikan di atas, pemusatan x1 akan berubah b0, b2, b3, dan b23.
[1 - "Pemusatan" digunakan oleh orang yang berbeda dengan cara yang cukup berbeda sehingga menyebabkan kebingungan. Seperti yang digunakan di sini, "memusatkan variabel pada #" berarti mengurangi # dari semua skor pada variabel, mengonversi skor asli menjadi penyimpangan dari #.]
Jadi mengapa tidak selalu berpusat pada sarana, secara rutin? Tiga alasan. Pertama, koefisien efek-utama dari variabel yang tidak terpusat mungkin menarik. Pemusatan dalam kasus seperti itu akan menjadi kontra-produktif, karena mengubah koefisien efek utama dari variabel lain.
Kedua, pemusatan akan membuat semua ekspresi M [.] 0, dan dengan demikian mengubah efek sederhana menjadi efek keseluruhan, hanya dalam model tanpa interaksi tiga arah atau lebih tinggi . Jika model berisi interaksi seperti itu maka perhitungan b -> B masih harus dilakukan, bahkan jika semua variabel berpusat pada kemampuannya.
Ketiga, memusatkan pada nilai seperti rata-rata, yang ditentukan oleh distribusi prediktor sebagai lawan dipilih secara rasional, berarti bahwa semua koefisien yang dipengaruhi oleh pemusatan akan spesifik untuk sampel khusus Anda. Jika Anda memusatkan pada mean, maka seseorang yang mencoba mereplikasi studi Anda harus memusatkan pada mean Anda, bukan mean mereka sendiri, jika mereka ingin mendapatkan koefisien yang sama dengan yang Anda dapatkan. Solusi untuk masalah ini adalah dengan memusatkan setiap variabel pada nilai pusat yang dipilih secara rasional dari variabel yang bergantung pada makna skor dan tidak bergantung pada distribusi skor. Namun, perhitungan b -> B masih tetap diperlukan.
Signifikansi dari keseluruhan efek dapat diuji dengan prosedur yang biasa untuk menguji kombinasi linear dari koefisien regresi. Namun, hasilnya harus ditafsirkan dengan hati-hati karena efek keseluruhan bukan parameter struktural tetapi tergantung pada desain. Parameter struktural - koefisien regresi (tidak terpusat, atau dengan pemusatan rasional) dan varians kesalahan - dapat diperkirakan tetap tidak berubah di bawah perubahan distribusi prediktor, tetapi efek keseluruhan umumnya akan berubah. Efek keseluruhan spesifik untuk sampel tertentu dan tidak boleh diharapkan untuk dibawa ke sampel lain dengan distribusi yang berbeda pada prediktor. Jika efek keseluruhan signifikan dalam satu studi dan tidak dalam yang lain, itu mungkin mencerminkan tidak lebih dari perbedaan dalam distribusi prediktor.