Apa makna intuitif memiliki hubungan linear antara log dari dua variabel?


20

Saya memiliki dua variabel yang tidak menunjukkan banyak korelasi ketika diplot terhadap satu sama lain sebagaimana adanya, tetapi hubungan linier yang sangat jelas ketika saya memetakan log masing-masing variabel terhadap yang lain.

Jadi saya akan berakhir dengan model tipe:

log(Y)=alog(X)+b
, yang sangat bagus secara matematis tetapi tampaknya tidak memiliki nilai penjelas dari model linear reguler.

Bagaimana saya bisa menafsirkan model seperti itu?


5
Saya tidak punya substansial untuk menambahkan jawaban yang ada, tetapi logaritma dalam hasil dan prediktor adalah elastisitas. Pencarian untuk istilah itu harus menemukan beberapa sumber yang bagus untuk menafsirkan hubungan itu, yang tidak terlalu intuitif.
Upper_Case-Stop Harming Monica

Interpretasi model log-log, di mana variabel dependen adalah log (y) dan variabel independen adalah log (x), adalah: . %Δ=β1%Δx
Bob

3
Link log-log komplementer adalah spesifikasi GLM yang ideal ketika hasilnya adalah biner (model risiko) dan paparannya bersifat kumulatif, seperti jumlah pasangan seksual vs infeksi HIV. jstor.org/stable/2532454
AdamO

2
@Alexis Anda dapat melihat titik lengket jika Anda overlay kurva. Coba curve(exp(-exp(x)), from=-5, to=5)vs curve(plogis(x), from=-5, to=5). Konkavitas semakin cepat. Jika risiko peristiwa dari satu pertemuan adalah p , maka risiko setelah peristiwa kedua adalah 1(1p)2 dan seterusnya, itu adalah bentuk logit probabilistik yang tidak akan ditangkap. Eksposur tinggi tinggi akan condong hasil regresi logistik lebih dramatis (palsu sesuai dengan aturan probabilitas sebelumnya). Beberapa simulasi akan menunjukkan ini kepada Anda.
AdamO

1
@AdamO Mungkin ada makalah pedagogis yang akan ditulis yang menggabungkan simulasi semacam itu yang memotivasi bagaimana memilih tautan hasil dikotomis tertentu dari ketiganya, termasuk situasi di mana ia dan tidak membuat perbedaan.
Alexis

Jawaban:


27

Anda hanya perlu mengambil eksponensial dari kedua sisi persamaan dan Anda akan mendapatkan hubungan potensial, yang mungkin masuk akal untuk beberapa data.

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

Dan karena hanyalah parameter yang dapat mengambil nilai positif apa pun, model ini setara dengan:eb

Y=cXa

Perlu dicatat bahwa ekspresi model harus menyertakan istilah kesalahan, dan perubahan variabel ini memiliki efek menarik di dalamnya:

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

Yaitu, model Anda dengan kesalahan aditif yang mematuhi kondisi untuk OLS (kesalahan yang terdistribusi normal dengan varians konstan) setara dengan model potensial dengan kesalahan multiplikasi yang logaritma mengikuti distribusi normal dengan varians konstan.


3
OP mungkin tertarik untuk mengetahui bahwa distribusi ini memiliki nama, log-normal: en.wikipedia.org/wiki/Log-normal_distribution
gardenhead

2
Bagaimana dengan efek ketidaksetaraan Jensen? Umumnya untuk cembung g,E[g(X)]g(E[X])
Stats

14

Anda dapat mengambil model log(Y)=alog(X)+b dan menghitung diferensial total, Anda akan berakhir dengan sesuatu seperti: yang hasil untuk

1YdY=a1XdX
dYdXXY=a

Oleh karena itu salah satu interpretasi sederhana dari koefisien akan menjadi perubahan persen untuk perubahan persen di . Ini berarti lebih jauh bahwa variabel pertumbuhan pada konstan fraksi ( ) dari laju pertumbuhan .aYXYa XaX


Jadi jika plot log-linear, apakah itu menyiratkan tingkat pertumbuhan yang konstan?
Dimitriy V. Masterov

Tidak benar-benar, tingkat pertumbuhan akan konstan jika dan hanya jika a = 0 . Ya=0
RScrlli

Tidak seiring waktu, tingkat pertumbuhan sehubungan dengan pertumbuhan x.
Dimitriy V. Masterov

pemesanan ulang tidak membantu, saya akan menghapusnya
Aksakal

1
@ DimitriyV.Masterov Ok, maka sejak adalah linear dalam log ( X ) itu berarti bahwa variabel Y tumbuh di sebagian kecil konstan laju pertumbuhan X . Apakah ada yang salah dengan jawaban saya menurut Anda? log(Y)log(X)YX
RScrlli

7

log intuitif memberi kita urutan besarnya variabel, sehingga kita dapat melihat hubungan sebagai urutan besarnya dua variabel yang terkait secara linear. Misalnya, meningkatkan prediktor dengan satu urutan magnitudo dapat dikaitkan dengan peningkatan tiga urutan magnitudo respons.

Ketika merencanakan menggunakan plot log-log, kami berharap dapat melihat hubungan linier. Menggunakan contoh dari pertanyaan ini , kita dapat memeriksa asumsi model linier:

log-log


3
+1 untuk jawaban intuitif untuk konsep yang tidak intuitif. Namun, gambar yang Anda masukkan jelas melanggar varians kesalahan konstan di prediktor.
Frans Rodenburg

1
Jawabannya benar, tetapi atribusi kepengarangan salah. Gambar tidak boleh dikaitkan dengan Gambar Google tetapi, setidaknya, ke halaman web di mana itu dapat ditemukan, yang dapat ditemukan hanya dengan mengklik gambar Google.
Pere

@Pere Saya tidak dapat menemukan sumber asli gambar sayangnya (setidaknya menggunakan pencarian gambar terbalik)
qwr

Tampaknya berasal dari diagramss.us meskipun situs itu sedang down dan sebagian besar halamannya tidak ada di Web Archive selain dari beranda
Henry

4

Rekonsiliasi jawaban dengan @Rrill dengan data diskrit aktual, pertimbangkan

log(Yt)=Sebuahlog(Xt)+b,log(Yt-1)=Sebuahlog(Xt-1)+b

log(Yt)-log(Yt-1)=Sebuah[log(Xt)-log(Xt-1)]

Tapi

log(Yt)log(Yt1)=log(YtYt1)log(Yt1+ΔYtYt1)=log(1+ΔYtYt1)

ΔYtYt1Yt1tYtgYt0.1

log(1+ΔYtYt1)ΔYtYt1=gYt

Karena itu kita dapatkan

gYtagXt

yang memvalidasi dalam studi empiris perlakuan teoritis @Rscrill.


1
Ini mungkin yang oleh ahli matematika disebut sebagai intuisi :)
Richard Hardy

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.