Adakah yang bisa menjelaskan cara menghitung efek marginal dari model Probit dan Logit dalam istilah awam?
Saya baru dalam statistik dan saya bingung tentang dua model ini.
Adakah yang bisa menjelaskan cara menghitung efek marginal dari model Probit dan Logit dalam istilah awam?
Saya baru dalam statistik dan saya bingung tentang dua model ini.
Jawaban:
Saya pikir cara yang lebih baik untuk melihat efek marginal dari variabel yang diberikan, katakanlah , adalah untuk menghasilkan sebaran sebaran probabilitas yang diprediksi pada sumbu vertikal, dan memiliki pada sumbu horizontal. Ini adalah cara paling "awam" yang bisa saya pikirkan untuk menunjukkan seberapa berpengaruh variabel yang diberikan. Tidak ada matematika, hanya gambar. Jika Anda memiliki banyak titik data, maka boxplot, atau scatterplot lebih lancar dapat membantu melihat di mana sebagian besar data berada (bukan hanya awan titik).X j
Tidak yakin bagaimana "orang awam" bagian berikutnya, tetapi Anda mungkin menemukan itu berguna.
Jika kita melihat efek marginal, sebut saja , perhatikan bahwa , kita dapatkan g ( p ) = ∑ k X k β k
Jadi efek marginal tergantung pada probabilitas yang diperkirakan dan gradien dari fungsi tautan di samping beta. Pembagian dengan , berasal dari aturan rantai untuk diferensiasi, dan fakta bahwa . Ini dapat ditunjukkan dengan membedakan kedua sisi dari persamaan yang benar-benar benar . Kami juga memiliki menurut definisi. Untuk model logit, kita memiliki , dan efek marginalnya adalah:∂ g - 1 ( z ) z=g[g-1(z)]g-1(XTβ)=pg(p)=log(p)-log(1-p)
Apa artinya ini? well adalah nol pada dan pada , dan mencapai nilai maksimumnya pada . Jadi efek marginal paling besar ketika probabilitasnya dekat , dan terkecil ketika dekat atau dekat . Namun, masih tergantung pada , sehingga efek marginalnya rumit. Bahkan, karena itu tergantung pada , Anda akan mendapatkan efek marginal yang berbeda untuk berbedap = 0 p = 1 0,25 p = 0,5 0,5 p 0 1 p ( 1 - p ) X j p X k ,nilai-nilai. Mungkin salah satu alasan bagus untuk melakukan plot pencar sederhana itu - tidak perlu memilih nilai kovariat mana yang akan digunakan.
Untuk model probit, kita memiliki mana adalah CDF normal standar, dan adalah pdf normal standar. Jadi kita dapatkan: Φ(.)ϕ(.)
Perhatikan bahwa ini memiliki sebagian besar properti yang efek marginal saya bahas sebelumnya, dan sama benarnya dengan semua fungsi tautan yang simetris sekitar (dan waras, tentu saja, misalnya ). Ketergantungan pada lebih rumit, tetapi masih memiliki bentuk umum "punuk" (titik tertinggi pada , terendah pada dan ). Fungsi tautan akan mengubah ukuran ketinggian maksimum (mis. Maksimum maksimum adalah , logit adalah ), dan seberapa cepat efek marginal diruncingkan ke nol. 0,5 g ( p ) = t a n ( πp0.50110,25
effects
paket di R dengan mudah dapat menghasilkan plot seperti probabilitas diprediksi pada sumbu vertikal vs X pada sumbu horisontal. Lihat socserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html
Model logit dan probit biasanya digunakan untuk mengetahui probabilitas bahwa variabel dependen y adalah 0 atau 1 berdasarkan sejumlah variabel input.
Dalam bahasa Inggris: Misalkan Anda mencoba memprediksi nilai biner, seperti apakah seseorang akan terserang penyakit jantung atau tidak selama hidupnya. Anda memiliki sejumlah variabel input seperti tekanan darah, usia, apakah mereka perokok atau tidak, BMI mereka, di mana mereka tinggal, dll. Semua variabel tersebut dapat berkontribusi dalam beberapa cara terhadap kemungkinan seseorang terserang penyakit jantung.
Efek marginal dari satu variabel input adalah jika Anda menaikkan variabel itu sedikit, bagaimana hal itu memengaruhi kemungkinan memiliki penyakit jantung? Seandainya tekanan darah meningkat sedikit, bagaimana hal itu mengubah kemungkinan menderita penyakit jantung? Atau jika Anda menaikkan usia satu tahun?
Beberapa efek ini bisa juga non-linear: meningkatkan BMI dalam jumlah sedikit mungkin memiliki efek yang sangat berbeda untuk seseorang yang memiliki BMI yang sangat sehat dibandingkan dengan orang yang tidak.
Anda masih ingin orang awam Anda tahu kalkulus, karena efek marginal adalah turunan dari probabilitas pas sehubungan dengan variabel bunga. Karena probabilitas pas adalah fungsi tautan (logit, probit atau apa pun) yang diterapkan pada nilai-nilai pas, Anda memerlukan aturan rantai untuk menghitungnya. Jadi, dalam model indeks linier (di mana parameter masuk sebagai sesuatu seperti X'b) itu sama dengan estimasi parameter dikalikan turunan dari fungsi tautan. Karena turunan berbeda pada nilai yang berbeda dari regressor (tidak seperti kasus model linier), Anda harus memutuskan, di mana untuk mengevaluasi efek marginal. Pilihan alami akan menjadi nilai rata-rata dari semua regressor. Pendekatan lain akan mengevaluasi efek untuk setiap pengamatan dan kemudian rata-rata atas mereka. Penafsirannya berbeda.