Saya telah mencoba untuk belajar lebih banyak tentang pembelajaran online akhir-akhir ini (ini benar-benar menarik!), Dan satu tema yang belum saya pahami dengan baik adalah bagaimana memikirkan pemilihan model dalam konteks offline versus online. Secara khusus, misalkan kita melatih classifier sebuah offline, berdasarkan beberapa data fixed set . Kami memperkirakan karakteristik kinerjanya melalui validasi silang, katakanlah, dan kami memilih classifier terbaik dengan cara ini.
Inilah yang saya pikirkan: bagaimana, kemudian, bagaimana kita menerapkan ke pengaturan online? Bisakah kita berasumsi bahwa terbaik yang ditemukan offline juga akan berfungsi dengan baik sebagai pengklasifikasi online? Apakah masuk akal untuk mengumpulkan beberapa data untuk melatih , kemudian mengambil classifier yang sama dan "mengoperasionalkannya" dalam pengaturan online dengan parameter yang sama ditemukan pada , atau mungkin pendekatan lain lebih baik? Apa peringatan dalam kasus ini? Apa hasil utama di sini? Dan seterusnya.
Ngomong-ngomong, sekarang yang ada di luar sana, saya kira apa yang saya cari adalah beberapa referensi atau sumber daya yang akan membantu saya (dan mudah-mudahan orang lain, yang telah memikirkan hal semacam ini!) Melakukan transisi dari berpikir semata-mata dalam istilah offline, dan kembangkan kerangka mental untuk memikirkan masalah pemilihan model dan pertanyaan-pertanyaan ini dengan cara yang lebih koheren ketika pembacaan saya berlanjut.