Arti sumbu y dalam plot ketergantungan parsial Hutan Acak


13

Saya menggunakan RandomForestpaket R dan bingung bagaimana menafsirkan nilai-nilai sumbu Y di plot ketergantungan parsial mereka. Help docs menyatakan bahwa plot adalah "penggambaran grafis dari efek marginal suatu variabel terhadap probabilitas kelas." Namun, saya masih bingung apa tepatnya yang mewakili sumbu y.

  • Khususnya, apa artinya nilai negatif?
  • Apa artinya memiliki pengaruh negatif terhadap prediksi kelas secara akurat?
  • Dan apa fitur yang paling penting dari angka-angka ini, apakah itu nilai maksimal, bentuk tren, dll?
  • Bisakah Anda membandingkan plot parsial dengan plot parsial variabel lain?
  • Bagaimana plot ini dibandingkan dengan kurva respons yang dibuat dalam Maxent (perangkat lunak pemodelan distribusi)?

Beberapa contoh plot ketergantungan parsial

Jawaban:


7

Menjawab keduanya terlebih dahulu:

Khususnya, apa artinya nilai negatif? Apa artinya memiliki pengaruh negatif terhadap prediksi kelas secara akurat?

Jika Anda melihat definisi bagaimana plot parsial dihitung dalam dokumentasi paket Random Forest , dikatakan bahwa plot menunjukkan kontribusi logit relatif dari variabel pada probabilitas kelas dari perspektif model. Dengan kata lain nilai negatif (dalam sumbu y) berarti bahwa kelas positif lebih kecil kemungkinannya untuk nilai variabel independen (sumbu x) sesuai dengan model. Demikian pula nilai positif berarti bahwa kelas positif lebih mungkin untuk nilai variabel independen sesuai dengan model. Jelas, nol menyiratkan tidak ada dampak rata-rata pada probabilitas kelas sesuai dengan model.

Dan apa fitur yang paling penting dari angka-angka ini, apakah itu nilai maksimal, bentuk tren, dll?

Ada banyak pendekatan berbeda untuk menentukan fitur penting dan nilai absolut maks hanyalah satu ukuran sederhana. Biasanya, orang melihat bentuk plot parsial untuk mengumpulkan pemahaman tentang apa yang disarankan model tentang hubungan dari variabel ke label kelas.

Bisakah Anda membandingkan plot parsial dengan plot parsial variabel lain?

Jawabannya kurang hitam dan putih. Anda dapat melihat kisaran sumbu y untuk setiap plot; Jika ketergantungan parsial pada satu variabel mendekati nol untuk seluruh rentang variabel, itu memberitahu Anda bahwa model tidak memiliki hubungan apa pun dari variabel ke label kelas. Kembali ke pertanyaan Anda, semakin besar rentangnya, semakin kuat pengaruhnya secara keseluruhan sehingga dalam hal ini mereka dapat dibandingkan.

Saya tidak punya pengalaman dengan Maxent.


Katakanlah model ini untuk 2 klasifikasi kelas, bagaimana menentukan kelas mana yang kelas positif dan mana yang negatif?
Kumar Vaibhav

Itu pertanyaan yang bagus, Anda harus bereksperimen dan melihat. Dokumentasi mengatakan pada halaman 17 di sini bahwa jika ymerupakan faktor maka ia menganggap itu masalah klasifikasi. Namun tidak disebutkan faktor mana yang akan dipetakan ke kelas positif atau kelas negatif. Saya berharap 1 atau benar dipetakan ke kelas positif dan 0, -1, atau salah dipetakan ke kelas negatif, tetapi saya tidak akan menerima begitu saja dalam R.
Chris A.

ada which.classargumen di partialPlotdan default ke tingkat faktor pertama y. Jadi, jika level pertama dari ykasus negatif, maka partialPlotakan memprediksi kasus negatif, yang mungkin tidak seperti yang diharapkan.
qoheleth
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.