Cox dan Wermuth (1996) atau Cox (1984) membahas beberapa metode untuk mendeteksi interaksi. Masalahnya biasanya seberapa umum istilah interaksi seharusnya. Pada dasarnya, kami (a) cocok (dan menguji) semua istilah interaksi orde kedua, satu per satu, dan (b) memplot nilai-p yang sesuai (yaitu, No. No. sebagai fungsi ). Idenya adalah untuk melihat apakah sejumlah istilah interaksi harus dipertahankan: Di bawah asumsi bahwa semua istilah interaksi adalah nol, distribusi nilai-p harus seragam (atau ekuivalen, titik-titik pada sebar plot harus didistribusikan secara kasar sepanjang sebuah garis yang melewati titik asal).1 - hal
Sekarang, seperti yang dikatakan @Gavin , menyesuaikan banyak (jika tidak semua) interaksi dapat menyebabkan overfitting, tetapi juga tidak berguna dalam arti tertentu (beberapa istilah interaksi tingkat tinggi seringkali tidak masuk akal sama sekali). Namun, ini ada hubungannya dengan interpretasi, bukan deteksi interaksi, dan review yang baik sudah disediakan oleh Cox dalam Interpretasi interaksi: Sebuah review ( The Annals of Applied Statistics 2007, 1 (2), 371-385) - itu termasuk referensi yang dikutip di atas. Garis penelitian lain yang layak untuk dilihat adalah studi tentang efek epistatik dalam studi genetika, khususnya metode yang didasarkan pada model grafis (misalnya, Metode yang efisien untuk mengidentifikasi interaksi statistik dalam jaringan asosiasi gen ).
Referensi
- Cox, DR dan Wermuth, N (1996). Ketergantungan Multivariat: Model, Analisis dan Interpretasi . Chapman dan Hall / CRC.
- Cox, DR (1984). Interaksi . Tinjauan Statistik Internasional , 52, 1–31.