Ini adalah data pelatihan saya: 200.000 Contoh x 10.000 Fitur. Jadi matriks data pelatihan saya adalah - 200.000 x 10.000.
Saya berhasil menyimpan ini dalam file datar tanpa memiliki masalah memori dengan menyimpan setiap dataset satu per satu (satu contoh demi satu) karena saya menghasilkan fitur untuk setiap contoh.
Tapi, sekarang ketika saya menggunakan Milk , SVM light , atau Algoritma Pembelajaran Mesin lainnya, semuanya mencoba memuat seluruh data pelatihan ke dalam memori alih-alih melatihnya satu per satu. Namun saya hanya memiliki 8 GB RAM, jadi saya tidak dapat melanjutkan dengan cara ini.
Tahukah Anda bahwa saya bisa melatih algoritma satu set data dengan satu set data? Yaitu, sehingga setiap saat saya hanya memiliki satu dataset dimuat ke dalam memori, saat pelatihan.