Interpretasi dari prediktor dan / atau respons yang diubah log

Saya bertanya-tanya apakah itu membuat perbedaan dalam interpretasi apakah hanya dependen, baik dependen dan independen, atau hanya variabel independen yang ditransformasikan log.

Pertimbangkan kasus

log(DV) = Intercept + B1*IV + Error

Saya bisa menafsirkan IV sebagai peningkatan persen tetapi bagaimana ini berubah ketika saya punya

log(DV) = Intercept + B1*log(IV) + Error

atau ketika saya punya

DV = Intercept + B1*log(IV) + Error

regression data-transformation interpretation regression-coefficients logarithm r dataset stata hypothesis-testing contingency-tables hypothesis-testing statistical-significance standard-deviation unbiased-estimator t-distribution r functional-data-analysis maximum-likelihood bootstrap regression change-point regression sas hypothesis-testing bayesian randomness predictive-models nonparametric terminology parametric correlation effect-size loess mean pdf quantile-function bioinformatics regression terminology r-squared pdf maximum multivariate-analysis references data-visualization r pca r mixed-model lme4-nlme distributions probability bayesian prior anova chi-squared binomial generalized-linear-model anova repeated-measures t-test post-hoc clustering variance probability hypothesis-testing references binomial profile-likelihood self-study excel data-transformation skewness distributions statistical-significance econometrics spatial r regression anova spss linear-model

— di atas
sumber

Saya merasa interpretasi "peningkatan persen" tidak benar, tetapi saya tidak memiliki cukup pemahaman untuk mengatakan mengapa tepatnya. Saya harap seseorang dapat membantu .... Di luar itu, saya akan merekomendasikan pemodelan menggunakan log jika mereka membantu untuk lebih baik membangun hubungan XY, tetapi melaporkan contoh-contoh yang dipilih dari hubungan itu menggunakan variabel asli. Terutama jika berhadapan dengan audiens yang tidak terlalu mengerti teknis.

— rolando2

@ rolando2: Saya tidak setuju. Jika model yang valid membutuhkan transformasi, maka interpretasi yang valid biasanya akan bergantung pada koefisien dari model yang diubah. Tetap menjadi tanggung jawab simpatisan untuk mengomunikasikan secara tepat makna koefisien-koefisien tersebut kepada audiens. Itu, tentu saja, mengapa kita dibayar mahal seperti itu sehingga gaji harus diubah terlebih dahulu.

— jthetzel

@BigBucks: Baiklah, lihat seperti ini. Misalkan audiens Anda tidak dapat memahami apa yang Anda maksudkan ketika Anda menjelaskan bahwa untuk setiap perubahan 1 pada log (basis 10) X, Y akan berubah sebesar b. Tetapi anggaplah mereka dapat memahami 3 contoh menggunakan nilai X 10, 100, dan 1000. Mereka pada saat itu kemungkinan akan menangkap sifat hubungan nonlinier. Anda masih bisa melaporkan keseluruhan, berbasis log b, tetapi memberikan contoh-contoh itu bisa membuat perbedaan.

— rolando2

.... Meskipun sekarang setelah saya membaca penjelasan hebat Anda di bawah ini, mungkin menggunakan "templat" itu dapat membantu banyak dari kita mengatasi masalah seperti ini dalam memahami.

— rolando2

Pembaca di sini mungkin juga ingin melihat utas yang terkait erat ini: Bagaimana menafsirkan koefisien yang ditransformasikan secara logaritma dalam regresi linier , & kapan-dan-mengapa-untuk-mengambil-log-dari-distribusi-angka-angka .

— gung - Reinstate Monica

Jawaban:

Charlie memberikan penjelasan yang bagus dan benar. Situs Computing Statistik di UCLA memiliki beberapa contoh lebih lanjut: http://www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htm , dan http://www.ats.ucla.edu/stat/mult_pkg/ faq / general / log_transformed_regress.htm

Hanya untuk melengkapi jawaban Charlie, di bawah ini adalah interpretasi spesifik dari contoh Anda. Seperti biasa, interpretasi koefisien mengasumsikan bahwa Anda dapat mempertahankan model Anda, bahwa diagnostik regresi memuaskan, dan bahwa data berasal dari studi yang valid.

Contoh A : Tidak ada transformasi

DV = Intercept + B1 * IV + Error

"Satu peningkatan unit IV dikaitkan dengan ( B1) peningkatan unit DV."

Contoh B : Hasil berubah

log(DV) = Intercept + B1 * IV + Error

"Satu peningkatan unit IV dikaitkan dengan ( B1 * 100) persen peningkatan DV."

Contoh C : Eksposur berubah

DV = Intercept + B1 * log(IV) + Error

"Satu persen peningkatan IV dikaitkan dengan ( B1 / 100) peningkatan unit DV."

Contoh D : Hasil berubah dan paparan berubah

log(DV) = Intercept + B1 * log(IV) + Error

"Satu persen peningkatan IV dikaitkan dengan ( B1) persen peningkatan DV."

— jthetzel
sumber

Apakah interpretasi ini berlaku terlepas dari dasar logaritma?

— Ayalew A.

Contoh B: Log hasil transformasi (DV) = Intersepsi + B1 * IV + Kesalahan "Satu peningkatan unit IV dikaitkan dengan peningkatan (B1 * 100) persen dalam DV Dalam hal ini, bagaimana Anda lakukan jika Anda ingin 30 liter dari Reduksi DV? Terima kasih atas jawaban Anda

— Antouria

Jadi log DV ~ B1 * (IV) adalah model yang baik untuk variabel dependen kontinu nol terikat?

— Bakaburg

Saya mungkin bingung. Jika Anda mentransformasikan hasilnya, Anda harus mengekspansi ulang koefisien untuk menemukan perbedaan multiplikatif. Menafsirkannya pada skala log hanya berfungsi sebagai perkiraan ketika rasionya sangat dekat dengan 1.

— AdamO

Tautan rusak.

— Nick Cox

β_{1} = \frac{\partial \log (y)}{\partial \log (x)} .

$\begin{equation*}\beta_1 = \frac{\partial \log(y)}{\partial \log(x)}.\end{equation*}$

\frac{\partial \log (y)}{\partial y} = \frac{1}{y}

$\begin{equation*} \frac{\partial \log(y)}{\partial y} = \frac{1}{y} \end{equation*}$

\partial \log (y) = \frac{\partial y}{y} .

$\begin{equation*} \partial \log(y) = \frac{\partial y}{y}. \end{equation*}$

y

$y$

x

$x$

$\beta_1$ $y$ $x$

Mengikuti logika yang sama, untuk model level-log, yang kita miliki

β_{1} = \frac{\partial y}{\partial \log (x)} = 100 \frac{\partial y}{100 \times \partial \log (x)} .

$\begin{equation*}\beta_1 = \frac{\partial y}{\partial \log(x)} = 100 \frac{\partial y}{100 \times \partial \log(x)}.\end{equation*}$

β_{1} / 100

$\beta_1/100$

y

$y$

x

$x$

— Charlie
sumber

\partial \log (y) = \frac{\partial y}{y} ?

$\begin{equation*} \partial \log(y) = \frac{\partial y}{y}? \end{equation*}$

\log (y)

$\log(y)$

y

$y$

\partial y

$\partial y$

\partial y \approx y_{1} - y_{0}

$\partial y \approx y_1 - y_0$

y

$y$

y

$y$

y

$y$

Tujuan utama dari regresi linier adalah untuk memperkirakan perbedaan rata-rata hasil yang membandingkan tingkat yang berdekatan dari seorang regressor. Ada banyak jenis cara. Kami paling akrab dengan rata-rata aritmatika.

SEBUAH M. (X) = \frac{(X_{1} + X_{2} + ... + X_{n})}{n}

$AM(X) = \frac{\left( X_1 + X_2 + \ldots + X_n \right)}{n}$

AM adalah apa yang diperkirakan menggunakan OLS dan variabel yang tidak diubah. Mean geometrik berbeda:

G M. (X) = \sqrt[n]{(X_{1} \times X_{2} \times ... \times X_{n})} = \exp (SEBUAH M. (catatan (X))

$GM(X) = \sqrt[\LARGE{n}]{\left( X_1 \times X_2 \times \ldots \times X_n \right)} = \exp(AM(\log(X))$

Praktis perbedaan GM adalah perbedaan multiplikatif: Anda membayar X% dari bunga saat mengambil pinjaman, kadar hemoglobin Anda berkurang X% setelah memulai metformin, tingkat kegagalan pegas meningkat X% sebagai sebagian kecil dari lebar. Dalam semua contoh ini, perbedaan rerata baku kurang masuk akal.

log(y) ~ x $\beta_1$ $X$ $e^{\beta_1}$

$e^{\beta_1} = 0.40$

$\log(x) \approx 1-x$ $X$ $\exp(0.05) \approx 1.05$ $X$ $\exp(0.5) = 1.65$ $Y$ $X$

y ~ log(x, base=2) $x$ $X$ $\beta_1$

Terakhir, log(y) ~ log(x)hanya menerapkan kedua definisi untuk mendapatkan perbedaan multiplikasi membandingkan kelompok yang berbeda secara multiplikasi dalam tingkat paparan.

— AdamO
sumber