Saya sering melihat orang-orang membicarakan validasi silang 5x2 sebagai kasus khusus validasi silang bersarang .
Saya berasumsi angka pertama (di sini: 5) mengacu pada jumlah lipatan di loop dalam dan nomor kedua (di sini: 2) mengacu pada jumlah lipatan di loop luar? Jadi, bagaimana hal ini berbeda dari pemilihan model dan pendekatan evaluasi "tradisional"? Dengan "tradisional", maksud saya
- pisahkan dataset menjadi pelatihan terpisah (mis., 80%) dan set tes
- gunakan k-fold cross-validation (mis. k = 10) untuk penyetelan hyperparameter dan pemilihan model pada set pelatihan
- mengevaluasi kinerja generalisasi dari model yang dipilih menggunakan set tes
Bukankah 5x2 persis sama kecuali bahwa set tes dan pelatihan memiliki ukuran yang sama jika k = 2?