Apa distribusi , di mana adalah distribusi yang seragam?

17

Saya memiliki empat variabel bebas terdistribusi seragam , masing-masing dalam . Saya ingin menghitung distribusi . Saya menghitung distribusi menjadi (maka ), dan dari menjadi Sekarang, distribusi jumlah adalah ( juga independen) karena $a,b,c,d$ $[0,1]$ $(a-d)^2+4bc$ $u_2=4bc$

f_{2} (u_{2}) = - \frac{1}{4} \ln \frac{u_{2}}{4}

$f_2(u_2)=-\frac{1}{4}\ln\frac{u_2}{4}$

u_{2} \in (0, 4]

$u_2\in(0,4]$

u_{1} = (a - d)^{2}

$u_1=(a-d)^2$

f_{1} (u_{1}) = \frac{1 - \sqrt{u_{1}}}{\sqrt{u_{1}}} .

$f_1(u_1)=\frac{1-\sqrt{u_1}}{\sqrt{u_1}}.$

u_{1} + u_{2}

$u_1+u_2$

u_{1}, u_{2}

$u_1,\, u_2$

f_{u_{1} + u_{2}} (x) = \int_{- \infty}^{+ \infty} f_{1} (x - y) f_{2} (y) d y = - \frac{1}{4} \int_{0}^{4} \frac{1 - \sqrt{x - y}}{\sqrt{x - y}} \cdot \ln \frac{y}{4} d y,

$f_{u_1+u_2}(x)=\int_{-\infty}^{+\infty}f_1(x-y)f_2(y)dy=-\frac{1}{4}\int_0^4\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy,$

y \in (0, 4]

$y\in(0,4]$ . Di sini, ia harus

x > y

$x>y$ sehingga integralnya sama dengan

f_{u_{1} + u_{2}} (x) = - \frac{1}{4} \int_{0}^{x} \frac{1 - \sqrt{x - y}}{\sqrt{x - y}} \cdot \ln \frac{y}{4} d y .

$f_{u_1+u_2}(x)=-\frac{1}{4}\int_0^{x}\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy.$ Sekarang saya masukkan ke Mathematica dan dapatkan

f_{u_{1} + u_{2}} (x) = \frac{1}{4} [- x + x \ln \frac{x}{4} - 2 \sqrt{x} (- 2 + \ln x)] .

$f_{u_1+u_2}(x)=\frac{1}{4}\left[-x+x\ln\frac{x}{4}-2\sqrt{x}\left(-2+\ln x\right)\right].$

Saya membuat empat set independen $a,b,c,d$ yang terdiri dari $10^6$ nomor masing-masing dan menarik histogram $(a-d)^2+4bc$ :

masukkan deskripsi gambar di sini

dan menggambar plot $f_{u_1+u_2}(x)$ :

masukkan deskripsi gambar di sini

Secara umum, plotnya mirip dengan histogram, tetapi pada interval $(0,5)$ sebagian besar negatif (root berada di 2,27034). Dan integral dari bagian positif adalah $\approx 0.77$ .

Dimana kesalahannya? Atau di mana saya melewatkan sesuatu?

EDIT: Saya memperbesar histogram untuk menampilkan PDF.

masukkan deskripsi gambar di sini

EDIT 2: Saya pikir saya tahu di mana masalah dalam alasan saya - dalam batas integrasi. Karena dan , saya tidak bisa hanya . Plot menunjukkan wilayah yang harus saya integrasikan di: $y\in (0,4]$ $x-y\in(0,1]$ $\int_0^x$

masukkan deskripsi gambar di sini

Ini berarti saya memiliki untuk (itu sebabnya bagian dari saya benar), dalam , dan in . Sayangnya, Mathematica gagal menghitung dua integral terakhir (well, ia menghitung yang kedua, dengan ada unit imajiner dalam output yang merusak segalanya ... ). $\int_0^x$ $y\in(0,1]$ $f$ $\int_{x-1}^x$ $y\in(1,4]$ $\int_{x-1}^4$ $y\in (4,5]$

EDIT 3: Tampaknya Mathematica CAN dapat menghitung tiga integral terakhir dengan kode berikut:

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1}, Assumptions -> 1 <= u2 <= 3 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4}, Assumptions -> 4 <= u2 <= 4 && u1 > 0]

yang memberikan jawaban yang benar :)

— corey979
sumber

2

Saya suka bahwa Anda telah mencoba memeriksa kewajaran jawaban Anda dengan simulasi. Masalah Anda adalah Anda tahu Anda telah membuat kesalahan, tetapi tidak bisa melihat dengan jelas di mana. Sudahkah Anda mempertimbangkan untuk memeriksa setiap tahap metode Anda, untuk memecahkan masalah di mana letak kesalahannya? Misalnya, apakah kesalahannya ada pada Anda ? Nah, Anda dapat memeriksa PDF terhitung Anda terhadap hasil simulasi seperti yang Anda lakukan untuk jawaban akhir Anda. Ditto untuk . Jika dan keduanya benar, maka Anda membuat kesalahan saat menggabungkannya. Pemeriksaan selangkah demi selangkah seperti itu memungkinkan Anda menentukan di mana Anda salah!

f_{1} (u_{1})

$f_1(u_1)$

f_{2}

$f_2$

f_{1}

$f_1$

f_{2}

$f_2$

— Silverfish

Saya membuang upaya pertama saya dan menghitung ulang dari awal. Saya percaya dan benar, meskipun saya harus secara manual mengalikan awal saya dengan 2 untuk membuatnya dinormalisasi menjadi satu. Tapi itu hanya mengubah ketinggian dan tidak menjelaskan mengapa saya memiliki negatif .

f_{1}

$f_1$

f_{2}

$f_2$

f_{1}

$f_1$

f

$f$

— corey979

Saat membuat histogram seperti itu untuk membandingkan dengan jumlah aljabar yang dihitung, skala histogram menjadi kepadatan yang valid (dan tumpukan jika mungkin). Lakukan pemeriksaan serupa untuk f1 dan f2 Anda untuk memastikan Anda memiliki hak tersebut; jika mereka benar (saya belum melihat alasan yang baik untuk mencurigai mereka, tetapi yang terbaik untuk memeriksa ulang), maka masalahnya pasti nanti.

— Glen_b -Reinstate Monica

19

Seringkali membantu menggunakan fungsi distribusi kumulatif.

Pertama,

F (x) = Pr ((a - d)^{2} \leq x) = Pr (| a - d | \leq \sqrt{x}) = 1 - (1 - \sqrt{x})^{2} = 2 \sqrt{x} - x .

$F(x) = \Pr((a-d)^2 \le x) = \Pr(|a-d| \le \sqrt{x}) = 1 - (1-\sqrt{x})^2 = 2\sqrt{x} - x.$

Lanjut,

G (y) = Pr (4 b c \leq y) = Pr (b c \leq \frac{y}{4}) = \int_{0}^{y / 4} d t + \int_{y / 4}^{1} \frac{y d t}{4 t} = \frac{y}{4} (1 - \log (\frac{y}{4})) .

$G(y) = \Pr(4 b c \le y) = \Pr(b c \le \frac{y}{4}) = \int_0^{y/4} dt + \int_{y/4}^1\frac{y\,dt}{4t} = \frac{y}{4}\left(1 - \log\left(\frac{y}{4}\right)\right).$

Biarkan berkisar antara nilai terkecil ( ) dan terbesar ( ) dari . Menulis dengan CDF dan dengan PDF , kita perlu menghitung $\delta$ $0$ $5$ $(a-d)^2 + 4 b c$ $x=(a-d)^2$ $F$ $y=4 b c$ $g = G^\prime$

H (δ) = Pr ((a - d)^{2} + 4 b c \leq δ) = Pr (x \leq δ - y) = \int_{0}^{4} F (δ - y) g (y) d y .

$H(\delta) = \Pr((a-d)^2 + 4 b c \le \delta) = \Pr(x\le \delta-y) = \int_0^4 F(\delta-y)g(y)dy.$

Kita bisa berharap ini menjadi jahat - distribusi PDF yang seragam tidak kontinu dan dengan demikian harus menghasilkan jeda dalam definisi - jadi agak menakjubkan bahwa Mathematica mendapatkan formulir tertutup (yang saya tidak akan mereproduksi di sini). Membedakannya sehubungan dengan memberikan kepadatan yang diinginkan. Ini didefinisikan secara berurutan dalam tiga interval. Dalam , $H$ $\delta$ $0 \lt \delta \lt 1$

H^{'} (δ) = h (δ) = \frac{1}{8} (8 \sqrt{δ} + δ (- (2 + \log (16))) + 2 (δ - 2 \sqrt{δ}) \log (δ)) .

$H^\prime(\delta) = h(\delta) = \frac{1}{8} \left(8 \sqrt{\delta }+\delta (-(2+\log (16)))+2 \left(\delta -2 \sqrt{\delta }\right) \log (\delta )\right).$

Dalam , $1 \lt \delta \lt 4$

h (δ) = \frac{1}{4} (- (δ + 1) \log (δ - 1) + δ \log (δ) - 4 \sqrt{δ} \coth^{- 1} (\sqrt{δ}) + 3 + \log (4)) .

$h(\delta) = \frac{1}{4} \left(-(\delta +1) \log (\delta -1)+\delta \log (\delta )-4 \sqrt{\delta } \coth ^{-1}\left(\sqrt{\delta }\right)+3+\log (4)\right).$

Dan dalam , $4 \lt \delta \lt 5$

\begin{aligned} h (δ) = \\ \frac{1}{4} (δ - 4 \sqrt{δ - 4} + (δ + 1) \log (\frac{4}{δ - 1}) + 4 \sqrt{δ} \tanh^{- 1} (\frac{\sqrt{(δ - 4) δ} - \sqrt{δ}}{δ - \sqrt{δ - 4}}) - 1) . \end{aligned}

$\eqalign{ &h(\delta) = \\ &\frac{1}{4}\left(\delta -4 \sqrt{\delta -4}+(\delta +1) \log \left(\frac{4}{\delta -1}\right)+4 \sqrt{\delta } \tanh ^{-1}\left(\frac{\sqrt{(\delta -4) \delta }-\sqrt{\delta }}{\delta -\sqrt{\delta -4}}\right)-1\right). }$

Angka

Gambar ini menunjukkan sebidang pada histogram realisasi . Keduanya hampir tidak bisa dibedakan, menunjukkan kebenaran rumus untuk . $h$ $10^6$ $(a-d)^2 + 4bc$ $h$

Berikut ini adalah solusi Mathematica yang hampir tanpa pemikiran, kasar . Secara otomatis ini mengotomatiskan segala sesuatu tentang perhitungan. Misalnya, ia bahkan akan menghitung rentang variabel yang dihasilkan:

ClearAll[ a, b, c, d, ff, gg, hh, g, h, x, y, z, zMin, zMax, assumptions];
assumptions = 0 <= a <= 1 && 0 <= b <= 1 && 0 <= c <= 1 && 0 <= d <= 1; 
zMax = First@Maximize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];
zMin = First@Minimize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];

Inilah semua integrasi dan diferensiasi. (Sabar; menghitung butuh beberapa menit.) $H$

ff[x_] := Evaluate@FullSimplify@Integrate[Boole[(a - d)^2 <= x], {a, 0, 1}, {d, 0, 1}];
gg[y_] := Evaluate@FullSimplify@Integrate[Boole[4 b c <= y], {b, 0, 1}, {c, 0, 1}];
g[y_]  := Evaluate@FullSimplify@D[gg[y], y];
hh[z_] := Evaluate@FullSimplify@Integrate[ff[-y + z] g[y], {y, 0, 4}, 
          Assumptions -> zMin <= z <= zMax];
h[z_]  :=  Evaluate@FullSimplify@D[hh[z], z];

Akhirnya, simulasi dan perbandingan dengan grafik : $h$

x = RandomReal[{0, 1}, {4, 10^6}];
x = (x[[1, All]] - x[[4, All]])^2 + 4 x[[2, All]] x[[3, All]];
Show[Histogram[x, {.1}, "PDF"], 
 Plot[h[z], {z, zMin, zMax}, Exclusions -> {1, 4}], 
 AxesLabel -> {"\[Delta]", "Density"}, BaseStyle -> Medium, 
 Ticks -> {{{0, "0"}, {1, "1"}, {4, "4"}, {5, "5"}}, Automatic}]

— whuber
sumber

8

(+1), terutama untuk mengingatkan orang bahwa, alih-alih mengatakan konvolusi kepadatan, "Seringkali membantu menggunakan fungsi distribusi kumulatif" - terutama ketika mereka memiliki bentuk yang sederhana seperti di sini. Dan kau sangat cepat juga.

— Alecos Papadopoulos

Itu tampak seperti solusi rapi yang ingin saya terima - tepat setelah saya memahaminya. Saya lebih seorang pria kalkulus daripada seorang probabilis; saat ini saya punya tiga pertanyaan: i) bagaimana Anda menggunakan CDF untuk mendapatkan dan , ii) mengapa ada dan bawah integral untuk , dan iii) bagaimana Anda dari bentuknya bahwa hasil solusi akan dilakukan sedikit demi sedikit?

F (x)

$F(x)$

G (y)

$G(y)$

F

$F$

g

$g$

H

$H$

— corey979

(1) dan adalah CDF. Mereka dihitung dari definisi CDF, seperti yang ditunjukkan oleh persamaan pertama setelah penampilan pertama mereka. Rinciannya harus jelas dalam kode yang saya masukkan. (2) Ini adalah rumus konvolusi untuk jumlah (lebih lengkap dijelaskan dalam perhitungan serupa di stats.stackexchange.com/a/144237 ). (3) Saya memasukkan tautan ke utas lain tentang properti distribusi seragam.

F

$F$

G

$G$

— whuber

7

Seperti OP dan whuber, saya akan menggunakan independensi untuk memecah ini menjadi masalah yang lebih sederhana:

Misalkan . Maka pdf dari , katakanlah adalah: $X = (a-d)^2$ $X$ $f(x)$

Biarkan . Maka pdf dari , katakanlah adalah: $Y = 4 b c$ $Y$ $g(y)$

Masalahnya mengurangi kini menemukan pdf dari . Mungkin ada banyak cara untuk melakukan ini, tetapi yang paling sederhana bagi saya adalah menggunakan fungsi yang disebut dari versi perkembangan saat ini dari mathStatica . Sayangnya, ini tidak tersedia dalam rilis publik pada saat ini, tetapi di sini adalah input: $X + Y$ TransformSum

TransformSum[{f,g}, z]

yang mengembalikan pdf dari sebagai fungsi piecewise: $Z = X + Y$

Berikut adalah plot dari pdf yang baru saja diturunkan, katakanlah : $h(z)$

Periksa cepat Monte Carlo

Diagram berikut membandingkan perkiraan Monte Carlo empiris dari pdf (berlekuk biru) ke pdf teoritis yang diturunkan di atas (putus-putus merah). Terlihat baik.

— serigala
sumber