Istilah pencarian yang Anda cari adalah "kurva pembelajaran", yang memberikan kinerja model (rata-rata) sebagai fungsi dari ukuran sampel pelatihan.
Kurva belajar tergantung pada banyak hal, misalnya
- metode klasifikasi
- kompleksitas penggolong
- seberapa baik kelas dipisahkan.
(Saya pikir untuk LDA dua kelas Anda mungkin dapat memperoleh beberapa perhitungan kekuatan teoretis, tetapi fakta penting adalah selalu apakah data Anda benar-benar memenuhi asumsi "sama dengan COV multivariat normal". Saya akan melakukan beberapa simulasi untuk kedua LDA asumsi dan resampling data Anda yang sudah ada).
Ada dua aspek kinerja classifier yang dilatih pada ukuran sampel hingga (seperti biasa),n
- Bias, yaitu rata-rata classifier yang dilatih pada sampel pelatihan lebih buruk daripada classifier yang dilatih pada training cases (ini biasanya dimaksudkan oleh kurva pembelajaran), dannn = ∞
- varians: satu set pelatihan tertentu kasus dapat menyebabkan kinerja model yang sangat berbeda.
Bahkan dengan beberapa kasus, Anda mungkin beruntung dan mendapatkan hasil yang baik. Atau Anda memiliki nasib buruk dan mendapatkan penggolong yang sangat buruk.
Seperti biasa, varian ini berkurang dengan bertambahnya ukuran sampel pelatihan .n
n
Aspek lain yang perlu Anda perhitungkan adalah bahwa biasanya tidak cukup untuk melatih classifier yang baik, tetapi Anda juga perlu membuktikan bahwa classifiernya bagus (atau cukup bagus). Jadi, Anda perlu merencanakan juga ukuran sampel yang diperlukan untuk validasi dengan presisi yang diberikan. Jika Anda perlu memberikan hasil ini sebagai bagian dari keberhasilan di antara begitu banyak kasus uji (misalnya, akurasi / presisi / sensitivitas / nilai prediksi positif produsen atau konsumen), dan tugas klasifikasi yang mendasarinya agak mudah, ini mungkin memerlukan lebih banyak kasus independen daripada pelatihan model yang bagus.
Sebagai aturan praktis, untuk pelatihan, ukuran sampel biasanya dibahas dalam kaitannya dengan kompleksitas model (jumlah kasus: jumlah variasi), sedangkan batas absolut pada ukuran sampel uji dapat diberikan untuk presisi yang diperlukan dari pengukuran kinerja.
Berikut ini makalah, di mana kami menjelaskan hal-hal ini secara lebih rinci, dan juga membahas cara
menyusun kurva pembelajaran: Beleites, C. dan Neugebauer, U. dan Bocklitz, T. dan Krafft, C. dan Popp, J .: Perencanaan ukuran sampel untuk model klasifikasi. Anal Chim Acta, 2013, 760, 25-33.
DOI: 10.1016 / j.aca.2012.11.007
naskah diterima di arXiv: 1211.1323
Ini adalah "penggoda", yang menunjukkan masalah klasifikasi yang mudah (kita sebenarnya memiliki satu perbedaan mudah seperti ini dalam masalah klasifikasi kita, tetapi kelas-kelas lain jauh lebih sulit untuk dibedakan):
Kami tidak mencoba mengekstrapolasi ke ukuran sampel pelatihan yang lebih besar untuk menentukan berapa banyak kasus pelatihan yang dibutuhkan, karena ukuran sampel uji adalah hambatan kami, dan ukuran sampel pelatihan yang lebih besar akan memungkinkan kami membuat model yang lebih rumit, sehingga ekstrapolasi dipertanyakan. Untuk jenis set data yang saya miliki, saya akan mendekati ini secara iteratif, mengukur banyak kasus baru, menunjukkan seberapa banyak hal membaik, mengukur lebih banyak kasus, dan sebagainya.
Ini mungkin berbeda untuk Anda, tetapi makalah ini berisi referensi literatur ke makalah yang menggunakan ekstrapolasi ke ukuran sampel yang lebih tinggi untuk memperkirakan jumlah sampel yang diperlukan.