Stepwise AIC - Apakah ada kontroversi seputar topik ini?

Saya telah membaca posting yang tak terhitung jumlahnya di situs ini yang sangat menentang penggunaan seleksi bertahap variabel menggunakan segala jenis kriteria apakah itu berbasis p-nilai, AIC, BIC, dll.

Saya mengerti mengapa prosedur ini secara umum, sangat buruk untuk pemilihan variabel. Pos gung yang mungkin terkenal di sini dengan jelas menggambarkan alasannya; akhirnya kami memverifikasi hipotesis pada dataset yang sama yang kami gunakan untuk menghasilkan hipotesis, yang hanya pengerukan data. Selain itu, nilai-p dipengaruhi oleh jumlah seperti collinearity dan outlier, yang hasilnya sangat miring, dll.

Namun, saya telah mempelajari peramalan time series sedikit belakangan ini dan telah menemukan buku pelajaran Hyndman yang sangat dihormati di mana ia menyebutkan di sini penggunaan seleksi bertahap untuk menemukan urutan optimal model ARIMA pada khususnya. Bahkan, dalam forecastpaket di R algoritma terkenal yang dikenal sebagai auto.arimadefault menggunakan seleksi bertahap (dengan AIC, bukan p-nilai). Dia juga mengkritik pemilihan fitur berdasarkan nilai-p yang selaras dengan banyak posting di situs web ini.

Pada akhirnya, kita harus selalu memvalidasi lintas dalam beberapa cara di akhir jika tujuannya adalah untuk mengembangkan model yang baik untuk perkiraan / prediksi. Namun, tentunya ini agak tidak setuju di sini ketika datang ke prosedur itu sendiri untuk metrik evaluasi selain dari p-nilai.

Apakah ada yang punya pendapat tentang penggunaan AIC bertahap dalam konteks ini, tetapi juga secara umum di luar konteks ini? Saya telah diajari untuk meyakini bahwa seleksi bertahap apa pun adalah buruk, tetapi jujur saja, auto.arima(stepwise = TRUE)telah memberi saya hasil sampel yang lebih baik daripada auto.arima(stepwise = FALSE)tetapi mungkin ini hanya kebetulan.

— aranglol
sumber

Salah satu dari beberapa hal yang dapat disetujui oleh peramal adalah bahwa memilih satu model "terbaik" biasanya bekerja kurang baik daripada menggabungkan beberapa model yang berbeda.

— S. Kolassa - Reinstate Monica

Ada beberapa masalah berbeda di sini.

Mungkin masalah utamanya adalah pemilihan model (apakah menggunakan nilai-p atau AIC, bertahap atau semua-himpunan bagian atau sesuatu yang lain) terutama bermasalah untuk inferensi (mis. Mendapatkan nilai-p dengan kesalahan tipe I yang sesuai, interval kepercayaan dengan cakupan yang sesuai). Untuk prediksi , pemilihan model memang dapat memilih tempat yang lebih baik pada poros tradeoff varians dan meningkatkan kesalahan out-of-sample.
Untuk beberapa kelas model, AIC secara asimptotik sama dengan kesalahan CV satu-keluar [lihat mis. Http://www.petrkeil.com/?p=836 ], jadi menggunakan AIC sebagai proksi yang efisien secara komputasi untuk CV adalah masuk akal.
Seleksi bertahap sering kali didominasi oleh metode pemilihan model lain (atau rata - rata ) (semua subset jika layak secara komputasi, atau metode penyusutan). Tetapi sederhana dan mudah diimplementasikan, dan jika jawabannya cukup jelas (beberapa parameter terkait dengan sinyal kuat, lainnya lemah, sedikit menengah), maka itu akan memberikan hasil yang masuk akal. Sekali lagi, ada perbedaan besar antara inferensi dan prediksi. Misalnya, jika Anda memiliki beberapa prediktor yang sangat berkorelasi, memilih yang salah (dari sudut pandang "kebenaran" / kausal) adalah masalah besar untuk disimpulkan, tetapi memilih yang kebetulan memberi Anda AIC terbaik adalah wajar strategi untuk prediksi (walaupun itu akan gagal jika Anda mencoba meramalkan situasi di mana korelasi prediktor berubah ...)

Intinya: untuk data berukuran sedang dengan rasio signal-to-noise yang masuk akal, seleksi bertahap berbasis AIC memang dapat menghasilkan model prediksi yang dapat dipertahankan ; lihat Murtaugh (2009) untuk contoh.

Murtaugh, Paul A. "Kinerja beberapa metode pemilihan variabel diterapkan pada data ekologis nyata." Surat ekologi 12, no. 10 (2009): 1061-1068.

— Ben Bolker
sumber

(+1) Sangat informatif. Pendekatan menggunakan AIC / BIC atau kriteria informasi lainnya tidak boleh dicampur dengan statistik inferensial menggunakan

p

$p$ -nilai dalam hal apa pun menurut buku Burnham & Anderson "Pemilihan model dan inferensi multimodel: Suatu informasi praktis - pendekatan teoretis."

— COOLSerdash

Tolong jangan mulai saya di Burnham dan Anderson. github.com/bbolker/discretization

— Ben Bolker