Saya memiliki model linier klasik, dengan 5 kemungkinan regresi. Mereka tidak berkorelasi satu sama lain, dan memiliki korelasi yang cukup rendah dengan respons. Saya telah sampai pada model di mana 3 dari regressor memiliki koefisien signifikan untuk statistik t mereka (p <0,05). Menambahkan salah satu atau kedua dari 2 variabel yang tersisa menghasilkan nilai p> 0,05 untuk statistik t, untuk variabel yang ditambahkan. Ini membuat saya percaya bahwa model 3 variabel adalah "terbaik".
Namun, dengan menggunakan perintah anova (a, b) dalam R di mana a adalah model variabel 3 dan b adalah model penuh, nilai p untuk statistik F adalah <0,05, yang memberitahu saya untuk lebih memilih model penuh daripada 3 variabel model. Bagaimana saya bisa mendamaikan kontradiksi yang tampak ini?
Terima kasih PS Edit: Beberapa latar belakang lebih lanjut. Ini adalah pekerjaan rumah jadi saya tidak akan memposting detail, tetapi kami tidak diberi rincian tentang apa yang diwakili oleh para regressor - mereka hanya diberi nomor 1 hingga 5. Kami diminta untuk "mendapatkan model yang sesuai, memberikan justifikasi".