Menjawab keduanya terlebih dahulu:
Khususnya, apa artinya nilai negatif? Apa artinya memiliki pengaruh negatif terhadap prediksi kelas secara akurat?
Jika Anda melihat definisi bagaimana plot parsial dihitung dalam dokumentasi paket Random Forest , dikatakan bahwa plot menunjukkan kontribusi logit relatif dari variabel pada probabilitas kelas dari perspektif model. Dengan kata lain nilai negatif (dalam sumbu y) berarti bahwa kelas positif lebih kecil kemungkinannya untuk nilai variabel independen (sumbu x) sesuai dengan model. Demikian pula nilai positif berarti bahwa kelas positif lebih mungkin untuk nilai variabel independen sesuai dengan model. Jelas, nol menyiratkan tidak ada dampak rata-rata pada probabilitas kelas sesuai dengan model.
Dan apa fitur yang paling penting dari angka-angka ini, apakah itu nilai maksimal, bentuk tren, dll?
Ada banyak pendekatan berbeda untuk menentukan fitur penting dan nilai absolut maks hanyalah satu ukuran sederhana. Biasanya, orang melihat bentuk plot parsial untuk mengumpulkan pemahaman tentang apa yang disarankan model tentang hubungan dari variabel ke label kelas.
Bisakah Anda membandingkan plot parsial dengan plot parsial variabel lain?
Jawabannya kurang hitam dan putih. Anda dapat melihat kisaran sumbu y untuk setiap plot; Jika ketergantungan parsial pada satu variabel mendekati nol untuk seluruh rentang variabel, itu memberitahu Anda bahwa model tidak memiliki hubungan apa pun dari variabel ke label kelas. Kembali ke pertanyaan Anda, semakin besar rentangnya, semakin kuat pengaruhnya secara keseluruhan sehingga dalam hal ini mereka dapat dibandingkan.
Saya tidak punya pengalaman dengan Maxent.