Kompetisi Kaggle menentukan peringkat akhir berdasarkan set tes yang diadakan.
Satu set tes yang diadakan adalah sampel; mungkin tidak mewakili populasi yang dimodelkan. Karena setiap pengiriman seperti hipotesis, algoritme yang memenangkan kompetisi mungkin saja, secara kebetulan, akhirnya cocok dengan set tes yang lebih baik daripada yang lain. Dengan kata lain, jika set tes yang berbeda dipilih dan kompetisi diulang, apakah rangkingnya tetap sama?
Untuk perusahaan sponsor, ini tidak terlalu penting (mungkin 20 proposal teratas akan meningkatkan baseline mereka). Meskipun, ironisnya, mereka mungkin akhirnya menggunakan model peringkat pertama yang lebih buruk daripada lima besar lainnya. Tetapi, bagi para peserta kompetisi, tampaknya Kaggle pada akhirnya adalah permainan kesempatan - keberuntungan tidak diperlukan untuk menemukan solusi yang tepat, itu diperlukan untuk menemukan solusi yang cocok dengan set tes!
Apakah mungkin untuk mengubah kompetisi sehingga semua tim teratas yang tidak dapat dibedakan secara statistik menang? Atau, dalam kelompok ini, dapatkah model yang paling murah hati dan murah secara komputasi menang?