Saya memiliki pertanyaan spesifik tentang validasi dalam penelitian pembelajaran mesin.
Seperti yang kita ketahui, rezim pembelajaran mesin meminta para peneliti untuk melatih model mereka pada data pelatihan, memilih dari model kandidat dengan set validasi, dan melaporkan akurasi pada set tes. Dalam studi yang sangat ketat, set tes hanya dapat digunakan satu kali. Namun, itu tidak pernah bisa menjadi skenario penelitian, karena kita harus meningkatkan kinerja kita sampai keakuratan tes lebih baik daripada hasil canggih sebelum kita dapat menerbitkan (atau bahkan menyerahkan) makalah.
Sekarang masalahnya. Katakanlah 50% adalah hasil paling canggih, dan model saya umumnya dapat mencapai akurasi 50--51, yang rata-rata lebih baik.
Namun, akurasi validasi terbaik saya (52%) menghasilkan akurasi tes yang sangat rendah, misalnya 49%. Kemudian, saya harus melaporkan 49% sebagai kinerja keseluruhan jika saya tidak dapat lebih lanjut meningkatkan validasi acc, yang saya pikir tidak ada harapan. Ini benar-benar mencegah saya dari mempelajari masalah, tetapi tidak masalah bagi teman-teman saya, karena mereka tidak melihat 52% acc, yang saya pikir merupakan pencilan.
Jadi, bagaimana orang biasanya melakukan dalam penelitian mereka?
validasi psk-fold tidak membantu, karena situasi yang sama mungkin masih terjadi.