Validasi silang adalah alat untuk memperkirakan varians metrik kinerja Anda karena keacakan dalam data (dan mungkin dalam algoritma pembelajaran jika tidak deterministik).
Jadi, jika Anda hanya menggunakan satu split, mis. 80% kereta + 20% tes dan laporkan metrik kinerja Anda dari percobaan tunggal ini, ada peluang bagus bahwa siapa pun yang mencoba mereproduksi eksperimen Anda menggunakan parameter yang persis sama akan menemukan angka kinerja yang berbeda (kadang-kadang sangat berbeda). Kecuali tentu saja Anda memberikan pemisahan yang sama persis yang tidak berarti.
Untuk kembali ke pertanyaan Anda, saya pikir Anda harus menggunakan CV untuk melaporkan kinerja Anda (mis. Lakukan CV 10 kali lipat dan melaporkan rata-rata dan standar deviasi dari metrik kinerja). Sekarang untuk menyetel algoritma Anda, Anda dapat menggunakan set validasi yang jauh lebih kecil yang diambil dari set pelatihan (pastikan itu tidak termasuk dalam set tes).
Jika Anda takut bahwa Anda tidak akan menemukan hyperparameters terbaik menggunakan set kecil maka Anda mungkin overfitting algoritma Anda ke spesifikasi dataset. Jika Anda tidak dapat menemukan konfigurasi menggunakan sampel kecil yang memberikan kinerja yang wajar di antara semua lipatan maka algoritme mungkin tidak terlalu berguna dalam praktiknya.
Juga perlu diingat bahwa beberapa algoritma terlalu lambat / tidak skala dengan baik dalam beberapa konfigurasi. Ini juga merupakan bagian dari pemilihan model praktis.
Karena Anda menyebutkan SVM, tentu saja sebagian besar implementasi akan lambat ketika mencoba menemukan parameter untuk kernel non-linear dengan pencarian kisi. Pencarian grid memiliki kompleksitas eksponensial, jadi gunakan dengan parameter yang sangat sedikit. Juga perlu diingat bahwa sebagian besar pustaka menyediakan parameter default yang masuk akal (atau setidaknya Anda menetapkan satu parameter dan ada heuristik untuk mengatur yang lain).