Perbedaan dua variabel acak logid normal

Biarkan dan menjadi 2 iidrv di mana . Saya ingin tahu distribusi untuk . $X_1$ $X_2$ $\log(X_1),\log(X_2) \sim N(\mu,\sigma)$ $X_1 - X_2$

Yang terbaik yang bisa saya lakukan adalah mengambil deret Taylor dari keduanya dan mendapatkan bahwa perbedaannya adalah jumlah perbedaan antara dua rv normal dan dua rv kuadrat-ku selain sisa perbedaan antara sisa istilah. Apakah ada cara yang lebih mudah untuk mendapatkan distribusi perbedaan antara 2 iid log-normal rv's?

— frayedchef
sumber

Ini makalah yang relevan. Anda akan menemukan lebih banyak kertas dengan googling! papers.ssrn.com/sol3/papers.cfm?abstract_id=2064829

— b halvorsen

Saya telah melihat sekilas pada kertas itu, dan sepertinya tidak menjawab pertanyaan saya dengan cara yang memuaskan. Mereka tampaknya peduli dengan perkiraan numerik untuk masalah yang lebih sulit menemukan distribusi untuk jumlah / perbedaan antara rn lognormal berkorelasi . Saya berharap akan ada jawaban yang lebih sederhana untuk kasus independen.

— frayedchef

Ini mungkin jawaban yang lebih sederhana dalam kasus independen, tetapi bukan jawaban yang sederhana! Kasus lognormal adalah kasus terkenal yang terkenal --- fungsi penghasil momen dari distribusi lognormal tidak ada --- yaitu, ia tidak bertemu pada interval terbuka yang mengandung nol. Jadi, Anda tidak akan menemukan solusi yang mudah.

— kjetil b halvorsen

Begitu ... Jadi, apakah pendekatan yang saya uraikan di atas masuk akal? (yaitu, jika , Apakah kita tahu apa-apa tentang syarat-syarat pesanan yang lebih tinggi, atau bagaimana mengikat mereka?

Y_{i} = \log (X_{i})

$Y_i = \log(X_i)$

X_{1} - X_{2} \approx (Y_{1} - Y_{2}) + (Y_{1}^{2} - Y_{2}^{2}) / 2 + . . .

$X_1 - X_2 \approx (Y_1 - Y_2) + (Y_1^2 - Y_2^2)/2 + {} ...$

— frayedchef

Untuk mengilustrasikan kesulitan --- mgf lognormal hanya didefinisikan pada . Untuk memperkirakan distribusi perbedaan dengan metode saddlepoint, kita perlu (K = kumulans gf) , dan jumlah itu hanya didefinisikan dalam satu poin, nol Jadi, sepertinya tidak berfungsi Jumlah atau rata-rata akan lebih mudah!

(- \infty, 0]

$(-\infty,0]$

K (s) + K (- s)

$K(s)+K(-s)$

— kjetil b halvorsen

Jawaban:

Ini masalah yang sulit. Saya pertama kali berpikir tentang menggunakan (perkiraan) fungsi penghasil momen dari distribusi lognormal. Itu tidak berhasil, seperti yang akan saya jelaskan. Tetapi pertama-tama beberapa notasi:

Biarkan menjadi kepadatan normal standar dan fungsi distribusi kumulatif yang sesuai. Kami hanya akan menganalisis distribusi kasus lognormal , yang memiliki fungsi kepadatan $\phi$ $\Phi$ $lnN(0,1)$ dan fungsi distribusi kumulatif Misalkandanadalah variabel acak independen dengan distribusi lognormal di atas. Kami tertarik pada distribusi, yang merupakan distribusi simetris dengan rata-rata nol. Marimenjadi fungsi pembangkit momen. Ini didefinisikan hanya untuk

f (x) = \frac{1}{\sqrt{2 π} x} e^{- \frac{1}{2} (dalam x)^{2}}

$f(x)=\frac1{\sqrt{2\pi}x} e^{-\frac12 (\ln x)^2}$

F (x) = Φ (dalam x)

$F(x) =\Phi(\ln x)$

X

$X$

Y

$Y$

D = X - Y

$D=X-Y$

M (t) = E e^{t X}

$M(t) = \DeclareMathOperator{\E}{E} \E e^{tX}$

X

$X$

, jadi tidak didefinisikan dalam interval terbuka yang berisi nol. Fungsi pembangkit momen untuk

adalah

Jadi, fungsi menghasilkan momen untuk

hanya didefinisikan untuk

t \in (- \infty, 0]

$t\in (-\infty,0]$

D

$D$

M_{D} (t) = E e^{t (X - Y)} = E e^{t X} E e^{- t Y} = M (t) M (- t)

$M_D(t)=\E e^{t(X-Y)}= \E e^{tX} \E e^{-tY}= M(t)M(-t)$

D

$D$

t = 0

$t=0$ , jadi tidak terlalu berguna.

$D$ $t\ge 0$

\begin{aligned} P (D \leq t) & = P (X - Y \leq t) \\ = \int_{0}^{\infty} P (X - y \leq t | Y = y) f (y) d y \\ = \int_{0}^{\infty} P (X \leq t + y) f (y) d y \\ = \int_{0}^{\infty} F (t + y) f (y) d y \end{aligned}

$\begin{align} P(D \le t) &= P(X-Y\le t) \\ &= \int_0^\infty P(X-y\le t | Y=y) f(y) \; dy \\ &= \int_0^\infty P(X\le t+y) f(y) \; dy \\ &= \int_0^\infty F(t+y) f(y) \; dy \end{align}$

t < 0

$t<0$

P (D \leq t) = 1 - P (D \leq | t |)

$P(D\le t)=1-P(D\le |t|)$

Ungkapan ini dapat digunakan untuk integrasi numerik atau sebagai dasar untuk simulasi. Tes pertama:

 integrate(function(y) plnorm(y)*dlnorm(y), lower=0,  upper=+Inf)
  0.5 with absolute error < 2.3e-06

yang jelas benar. Mari kita selesaikan ini di dalam suatu fungsi:

pDIFF  <-  function(t) {
    d  <-  t
    for (tt in seq(along=t)) {
        if (t[tt] >= 0.0) d[tt] <- integrate(function(y) plnorm(y+t[tt])*dlnorm(y),
                                         lower=0.0,  upper=+Inf)$value else
                          d[tt] <- 1-integrate(function(y) plnorm(y+abs(t[tt]))*dlnorm(y),
                                         lower=0.0, upper=+Inf)$value
    }
    return(d)
}

> plot(pDIFF,  from=-5,  to=5)

pemberian yang mana:

Kemudian kita dapat menemukan fungsi kerapatan dengan membedakan di bawah tanda integral, memperoleh

dDIFF  <-  function(t) {
       d  <- t; t<- abs(t)
       for (tt in seq(along=t)) {
           d[tt]  <-  integrate(function(y) dlnorm(y+t[tt])*dlnorm(y),
                                lower=0.0,  upper=+Inf)$value
       }
       return(d)
}

yang dapat kami uji:

> integrate(dDIFF,  lower=-Inf,  upper=+Inf)
0.9999999 with absolute error < 1.3e-05

Dan memplot kepadatan yang kita dapatkan:

plot(dDIFF,  from=-5,  to=5)

Saya juga mencoba untuk mendapatkan beberapa perkiraan analitik, tetapi sejauh ini tidak berhasil, ini bukan masalah yang mudah. Tetapi integrasi numerik seperti di atas, diprogram dalam R sangat cepat pada perangkat keras modern, sehingga merupakan alternatif yang baik yang mungkin harus digunakan lebih banyak.

— kjetil b halvorsen
sumber

$X$ $Y$

\begin{aligned} Pr (\frac{X}{Y} \leq t) & = Pr (\log (\frac{X}{Y}) \leq \log (t)) \\ = Pr (\log (X) - \log (Y) \leq \log (t)) \\ \sim N (0, 2 σ^{2}) \end{aligned}

$\begin{align} \Pr\left(\frac{X}{Y} \leq t\right) &= \Pr\left(\log\left(\frac{X}{Y}\right) \leq \log(t) \right) \\ &= \Pr(\log(X) - \log(Y) \leq \log(t)) \\ &\sim \mathcal{N}(0, 2 \sigma^2) \end{align}$

Tergantung pada aplikasi Anda, ini dapat melayani kebutuhan Anda.

— Vincent Traag
sumber

Tapi bukankah kita melihat XY bukannya log (X) - log (Y)?

— Sextus Empiricus

Ya tentu saja. Ini hanya dalam kasus seseorang akan tertarik mengetahui bagaimana dua variabel lognormal berbeda satu sama lain tanpa harus perlu menjadi perbedaan. Itu sebabnya saya juga mengatakan itu tidak menjawab pertanyaan.

— Vincent Traag