Saya memiliki satu set data kata-kata. Saya secara acak memilih beberapa poin dan menggunakannya untuk pengujian dan yang lainnya digunakan untuk pelatihan.
- kasus (1) Saya hanya mengambil setiap titik data dari set tes dan mengklasifikasikannya memiliki label kelas yang sama dengan titik terdekat dari set kereta.
- kasus (2) Saya melakukan klasifikasi menggunakan classifier terawasi yang diketahui.
Saya selalu mendapatkan tingkat pengakuan yang lebih baik jika (1). Artinya, tidak melakukan pembelajaran sama sekali, lebih baik daripada menggunakan pembelajaran yang diawasi, untuk kumpulan data ini (dan lainnya)! Apakah itu situasi yang sering terjadi?