Saya akan menyarankan pencarian singkat tentang " diagnostik model regresi linier " sebagai permulaan. Tetapi di sini ada beberapa yang saya sarankan Anda periksa:
Pastikan asumsi dipenuhi dengan memuaskan
Gunakan scatterplot atau komponen plus plot sisa untuk menguji hubungan linear antara prediktor independen dan variabel dependen.
Buat plot dengan residual terstandarisasi dibandingkan nilai prediksi dan pastikan tidak ada titik ekstrem dengan residu sangat tinggi, dan sebaran residu sebagian besar sama di sepanjang nilai prediksi, serta sebaran sebagian besar sama di atas dan di bawah rata-rata residu, nol.
Anda juga dapat mengubah sumbu y ke residual . Plot ini membantu mengidentifikasi varian yang tidak sama.2
Periksa kembali desain penelitian untuk memastikan asumsi independensi masuk akal.
Ambil varians inflation factor (VIF) atau statistik toleransi untuk memeriksa kemungkinan collinearity.
Periksa titik-titik pengaruh potensial
- Periksa statistik seperti Cook's D, DFits, atau DF Beta untuk mengetahui apakah suatu titik data tertentu secara drastis mengubah hasil regresi Anda. Anda dapat menemukan lebih banyak di sini .
Periksa perubahan dalam statistik dan AdjustedR2R2
- Menjadi rasio jumlah regresi kuadrat dengan jumlah total kuadrat, dapat memberi tahu Anda berapa% variabilitas dalam variabel dependen Anda dijelaskan oleh model.R2
- Adjusted dapat digunakan untuk memeriksa apakah jumlah kuadrat tambahan yang dihasilkan oleh prediksi saya tambahan benar-benar sebanding dengan tingkat kebebasan yang akan mereka ambil.R2
Periksa interaksi yang diperlukan
- Jika ada prediktor independen utama, sebelum Anda membuat interpretasi atas efek independennya, periksa apakah ia berinteraksi dengan variabel independen lainnya. Interaksi, jika dibiarkan tidak disesuaikan, dapat membiaskan perkiraan Anda.
Terapkan model Anda ke kumpulan data lain dan periksa kinerjanya
- Anda juga dapat menerapkan rumus regresi ke data terpisah lainnya dan melihat seberapa baik prediksi itu. Grafik seperti sebar plot dan statistik seperti% perbedaan dari nilai yang diamati dapat menjadi awal yang baik.
r-squared
tag dangoodness-of-fit
tag ..