Dalam kebanyakan estimator pada scikit-belajar, ada n_jobs
parameter dalam fit
/ predict
metode untuk menciptakan lapangan kerja paralel menggunakan joblib
. Saya perhatikan bahwa pengaturan untuk -1
membuat hanya 1 proses Python dan memaksimalkan core, menyebabkan penggunaan CPU mencapai 2500% di atas. Ini sangat berbeda dari pengaturan ke beberapa integer positif> 1, yang menciptakan banyak proses Python pada ~ 100% penggunaan.
Bagaimana pengaturan itu mempengaruhi penggunaan CPU & inti pada server Linux multi-CPU? (misal jika n_jobs=8
kemudian apakah 8 CPU sepenuhnya terkunci atau apakah CPU masih menyimpan beberapa core untuk tugas / proses lain?)
Selain itu, saya MemoryError
kadang-kadang mendapatkan ketika mengatur n_jobs=-1
untuk dataset besar. Namun, penggunaan memori biasanya berkisar sekitar 30-40% untuk proses Python tunggal. Bagaimana data & memori dikelola / disalin tergantung pada nilai n_jobs
?