Dalam kebanyakan estimator pada scikit-belajar, ada n_jobsparameter dalam fit/ predictmetode untuk menciptakan lapangan kerja paralel menggunakan joblib. Saya perhatikan bahwa pengaturan untuk -1membuat hanya 1 proses Python dan memaksimalkan core, menyebabkan penggunaan CPU mencapai 2500% di atas. Ini sangat berbeda dari pengaturan ke beberapa integer positif> 1, yang menciptakan banyak proses Python pada ~ 100% penggunaan.
Bagaimana pengaturan itu mempengaruhi penggunaan CPU & inti pada server Linux multi-CPU? (misal jika n_jobs=8kemudian apakah 8 CPU sepenuhnya terkunci atau apakah CPU masih menyimpan beberapa core untuk tugas / proses lain?)
Selain itu, saya MemoryErrorkadang-kadang mendapatkan ketika mengatur n_jobs=-1untuk dataset besar. Namun, penggunaan memori biasanya berkisar sekitar 30-40% untuk proses Python tunggal. Bagaimana data & memori dikelola / disalin tergantung pada nilai n_jobs?