Sudah mapan, setidaknya di antara ahli statistik dari beberapa kaliber lebih tinggi, bahwa model dengan nilai-nilai statistik AIC dalam batas tertentu dari nilai minimum harus dianggap sesuai dengan model meminimalkan statistik AIC. Sebagai contoh, dalam [1, hal.221] kita temukan
Maka model dengan GCV kecil atau AIC akan dianggap yang terbaik. Tentu saja seseorang seharusnya tidak hanya secara buta meminimalkan GCV atau AIC. Sebaliknya, semua model dengan nilai GCV atau AIC yang cukup kecil harus dianggap berpotensi sesuai dan dievaluasi sesuai dengan kesederhanaan dan relevansi ilmiahnya.
Demikian pula, dalam [2, hal.144] yang kita miliki
Telah dikemukakan (Duong, 1984) bahwa model dengan nilai AIC dalam c dari nilai minimum harus dianggap kompetitif (dengan c = 2 sebagai nilai khas). Seleksi dari antara model kompetitif kemudian dapat didasarkan pada faktor-faktor seperti keputihan residu (Bagian 5.3) dan kesederhanaan model.
Referensi:
- Ruppert, D .; Tongkat, MP & Carrol, Regresi RJ Semiparametric , Cambridge University Press, 2003
- Brockwell, PJ & Davis, RA Pengantar deret waktu dan peramalan , John Wiley & Sons, 1996
Jadi mengingat hal di atas, yang mana dari dua model di bawah ini yang lebih disukai?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
Lebih umum, kapan tepat untuk memilih model dengan meminimalkan secara buta AIC atau statistik terkait?