Apakah Anda tahu referensi atau nama untuk cara berikut untuk menyelidiki apakah teknik pemodelan yang kompleks Apakah bias?
- Menerapkan ke kumpulan data asli. Ukur kinerjanya (mis. R-kuadrat dalam pengaturan regresi).
- Secara acak mengubah variabel respons untuk mendapatkan kumpulan data baru. Menerapkan dan mengukur kinerjanya . [Jika pengamatannya tergantung, langkah ini lebih rumit.]
Jika secara substansial berbeda dari kinerja nol, kami menyimpulkan bias.
Langkah 2 dapat diulang jika sumber daya memungkinkan, yang akan menyebabkan permutasi distribusi nol dari ukuran kinerja. Tetapi dalam aplikasi saya, saya tidak bisa melakukan ini karena masalah sumber daya.
Saya ingat dengan keliru bahwa trik "perombakan" ini digunakan oleh seseorang untuk menyelidiki bias dari validasi silang meninggalkan-satu-keluar (dalam beberapa situasi). Namun, saya tidak tahu apakah dia berada dalam situasi saya di mana dia dapat mengulangi seluruh proses hanya sekali.
Contoh dalam R yang menunjukkan "kekuatan" seleksi mundur naif:
# Generate random data set. Only random performance is expected.
n <- 100
p <- 30
set.seed(7567)
y <- rnorm(n)
X <- rnorm(n*p)
dim(X) <- c(n, p)
data <- data.frame(y, X)
# Modelling technique: backward selection with OLS
T <- function(data) {
step(lm(y ~ ., data = data), trace = 0)
}
# Performance: R-squared
P <- function(fit) {
summary(fit)$r.squared
}
# Step 1: Compute performance on original data. Happily publish high R-squared...
P(T(data)) # 0.240405
# Step 2: Your mean colleague reshuffles response and gets also R-squared far away from 0
data$y <- data$y[sample(n)]
P(T(data)) # 0.1925726
Kesimpulan pada contoh: Teknik pemodelan yang dipilih sangat rentan terhadap overfitting, setidaknya dalam pengaturan khusus ini.
Beberapa latar belakang
Saya pernah menggunakan trik perombakan ini untuk memeriksa apakah validasi silang dari beberapa proses pemodelan yang membosankan diterapkan dengan baik oleh saya. Di bawah permutasi acak, CV memberikan R-kuadrat dasarnya 0 (seperti yang diharapkan / diinginkan).