Saya telah menggunakan ganda lintas validasi beberapa kali sekarang untuk mengevaluasi kinerja beberapa algoritma belajar, tapi aku selalu bingung bagaimana aku harus memilih nilai .
Saya sering melihat dan menggunakan nilai , tetapi ini tampaknya benar-benar sewenang-wenang bagi saya, dan sekarang saya hanya menggunakan dengan kebiasaan daripada memikirkannya. Bagi saya tampaknya Anda mendapatkan rincian yang lebih baik karena Anda meningkatkan nilai , jadi idealnya Anda harus membuat Anda sangat besar, tetapi ada juga risiko yang bias.
Saya ingin tahu apa nilai harus bergantung pada, dan bagaimana saya harus berpikir tentang ini ketika saya mengevaluasi algoritma saya. Apakah itu mengubah sesuatu jika saya menggunakan versi stratifikasi validasi silang atau tidak?