Tidak semua prosedur statistik terpecah menjadi data pelatihan / pengujian, juga disebut "validasi silang" (meskipun seluruh prosedur melibatkan sedikit lebih banyak dari itu).
Sebaliknya, ini adalah teknik yang secara khusus digunakan untuk memperkirakan kesalahan out-of-sample ; yaitu seberapa baik model Anda memprediksi hasil baru menggunakan dataset baru? Ini menjadi masalah yang sangat penting ketika Anda memiliki, misalnya, sejumlah besar prediktor relatif terhadap jumlah sampel dalam dataset Anda. Dalam kasus seperti itu, sangat mudah untuk membangun model dengan kesalahan sampel yang besar tetapi kesalahan sampel yang buruk (disebut "over fitting"). Dalam kasus di mana Anda memiliki sejumlah besar prediktor dan sejumlah besar sampel, validasi silang adalah alat yang diperlukan untuk membantu menilai seberapa baik model akan berperilaku ketika memprediksi pada data baru. Ini juga merupakan alat penting ketika memilih antara model prediksi yang bersaing.
Pada catatan lain, validasi silang hampir selalu hanya digunakan ketika mencoba membangun model prediksi . Secara umum, tidak terlalu membantu untuk model ketika Anda mencoba memperkirakan efek dari beberapa perawatan. Misalnya, jika Anda membandingkan distribusi kekuatan tarik antara bahan A dan B ("perlakuan" menjadi jenis bahan), validasi silang tidak akan diperlukan; sementara kami benar-benar berharap bahwa perkiraan efek pengobatan kami menggeneralisasi dari sampel, untuk sebagian besar masalah, teori statistik klasik dapat menjawab ini (yaitu "kesalahan standar" dari perkiraan) lebih tepatnya daripada validasi silang. Sayangnya, metodologi statistik klasik 1untuk kesalahan standar tidak tahan jika overfitting. Validasi silang seringkali jauh lebih baik dalam hal itu.
Di sisi lain, jika Anda mencoba memprediksi kapan suatu materi akan pecah berdasarkan 10.000 variabel terukur yang Anda masukkan ke dalam model pembelajaran mesin berdasarkan 100.000 pengamatan, Anda akan mengalami banyak masalah dalam membangun model yang hebat tanpa validasi silang!
Saya menduga dalam banyak percobaan fisika yang dilakukan, Anda umumnya tertarik pada estimasi efek. Dalam kasus-kasus itu, sangat sedikit kebutuhan untuk validasi silang.
1 Orang dapat berargumen bahwa metode Bayesian dengan prior informatif adalah metodologi statistik klasik yang membahas overfitting. Tapi itu diskusi lain.
Catatan: sementara validasi silang pertama kali muncul dalam literatur statistik, dan jelas digunakan oleh orang-orang yang menyebut diri mereka ahli statistik, itu menjadi alat yang diperlukan mendasar dalam komunitas pembelajaran mesin. Banyak model statistik akan bekerja dengan baik tanpa menggunakan cross-validation, tetapi hampir semua model yang dianggap "model prediksi pembelajaran mesin" memerlukan cross-validation, karena mereka sering memerlukan pemilihan parameter tuning, yang hampir mustahil dilakukan tanpa cross -validasi.