Probabilitas bahwa titik-titik acak seragam dalam sebuah persegi panjang memiliki jarak Euclidean kurang dari ambang yang diberikan

Asumsikan kita memiliki titik dalam persegi panjang dengan batas , dan titik-titik ini terdistribusi secara merata di bidang ini. (Saya tidak begitu familiar dengan statistik, jadi saya tidak tahu perbedaan antara memilih secara seragam sebuah simpul di area , atau secara seragam memilih -aksi dari dan -aksi dari secara independen). $n$ $[0,a] \times [0,b]$ $[0,a] \times [0,b]$ $x$ $[0,a]$ $y$ $[0,b]$

Diberi ambang jarak , saya mungkin ingin tahu probabilitas bahwa jarak dua titik 'Euclidean kurang dari , atau lebih tepatnya, berapa banyak pasangan node' jarak akan kurang dari ? $d$ $d$ $d$

Mungkin uraian berikut tidak akan mendua.

Biarkan saya menentukan masalah ini. Diberikan node dan ambang batas . Ini poin didistribusikan secara merata dalam persegi panjang . Nyatakan variabel acak sebagai jumlah pasangan titik dalam jarak . Temukan . $n$ $d$ $n$ $[0,a] \times [0,b]$ $\xi$ $d$ $E[\xi]$

probability distance

— zhouzhuojie
sumber

Anda harus menelusuri pertanyaan-pertanyaan di math.SE juga, karena saya ingat beberapa yang terkait di sana. Mereka kemungkinan ditandai probability.

— kardinal

Berikut adalah beberapa pertanyaan yang saya ingat pernah saya lihat di math.SE, tetapi tidak satu pun dari mereka yang Anda tanyakan: ( 1 ) math.stackexchange.com/questions/64028 ( 2 ) math.stackexchange.com/questions/66777 ( 3 ) math.stackexchange.com/questions/101692 ( 4 ) math.stackexchange.com/questions/50775

— kardinal

Kita dapat memecahkan masalah ini secara analitis menggunakan beberapa intuisi dan argumen geometris . Sayangnya, jawabannya cukup panjang dan agak berantakan.

Pengaturan dasar

Pertama, mari kita buat beberapa notasi. Asumsikan kita menggambar titik secara seragam secara acak dari kotak . Kami berasumsi tanpa kehilangan keumuman bahwa . Biarkan menjadi koordinat dari titik pertama dan menjadi koordinat dari titik kedua. Kemudian, , , , dan saling independen dengan didistribusikan secara seragam pada dan didistribusikan secara seragam pada . $[0,a] \times [0,b]$ $0 < b < a$ $(X_1,Y_1)$ $(X_2,Y_2)$ $X_1$ $X_2$ $Y_1$ $Y_2$ $X_i$ $[0,a]$ $Y_i$ $[0,b]$

Pertimbangkan jarak Euclidean antara dua titik. Ini adalah manadan.

D = \sqrt{(X_{1} - X_{2})^{2} + (Y_{1} - Y_{2})^{2}} =: \sqrt{Z_{1}^{2} + Z_{2}^{2}},

$D = \sqrt{(X_1-X_2)^2 + (Y_1-Y_2)^2} =: \sqrt{ Z_1^2 + Z_2^2} \> ,$

Z_{1} = | X_{1} - X_{2} |

$Z_1 = |X_1-X_2|$

Z_{2} = | Y_{1} - Y_{2} |

$Z_2 = |Y_1-Y_2|$

Distribusi segitiga

Karena dan adalah seragam independen, maka memiliki distribusi segitiga, di manamemiliki distribusi dengan fungsi kerapatan Fungsi distribusi yang sesuai adalah untuk . Demikian pula,memiliki kepadatan dan fungsi distribusi . $X_1$ $X_2$ $X_1 - X_2$ $Z_1 = |X_1 - X_2|$

f_{a} (z_{1}) = \frac{2}{a^{2}} (a - z_{1}), 0 < z_{1} < a .

$f_a(z_1) = \frac{2}{a^2}(a-z_1) ,\quad 0 < z_1 < a \> .$

F_{a} (z_{1}) = 1 - (1 - z_{1} / a)^{2}

$F_a(z_1) = 1 - (1-z_1/a)^2$

0 \leq z_{1} \leq a

$0 \leq z_1 \leq a$

Z_{2} = | Y_{1} - Y_{2} |

$Z_2 = |Y_1 - Y_2|$

f_{b} (z_{2})

$f_b(z_2)$

F_{b} (z_{2})

$F_b(z_2)$

Perhatikan bahwa karena adalah fungsi hanya dari dua dan adalah fungsi hanya dari , maka dan independen. Jadi jarak antara titik adalah norma euclidean dari dua variabel acak independen (dengan distribusi yang berbeda). $Z_1$ $X_i$ $Z_2$ $Y_i$ $Z_1$ $Z_2$

Panel kiri gambar menunjukkan distribusi dan panel kanan menunjukkandi mana dalam contoh ini. $X_1 - X_2$ $Z_1 = |X_1 - X_2|$ $a = 5$

Kepadatan segitiga

Beberapa probabilitas geometris

Jadi dan independen dan didukung pada dan $Z_1$ $Z_2$ $[0,a]$ $[0,b]$ masing-masing. Untuk diperbaiki $d$ , fungsi distribusi jarak euclidean adalah

P (D \leq d) = \iint_{{z_{1}^{2} + z_{2}^{2} \leq d^{2}}} f_{a} (z_{1}) f_{b} (z_{2}) d z_{1} d z_{2} .

$\renewcommand{\Pr}{\mathbb P}\newcommand{\rd}{\,\mathrm{d}} \Pr(D \leq d) = \iint_{\{z_1^2+z_2^2 \leq d^2\}} f_a(z_1) f_b(z_2) \rd z_1 \rd z_2 \> .$

Kita dapat menganggap ini secara geometris memiliki distribusi pada persegi panjang dan mempertimbangkan seperempat lingkaran jari-jari . Kami ingin mengetahui probabilitas yang ada di dalam persimpangan dua wilayah ini. Ada tiga kemungkinan berbeda untuk dipertimbangkan: $[0,a] \times [0,b]$ $d$

Wilayah 1 (oranye): . Di sini lingkaran seperempat terletak sepenuhnya di dalam persegi panjang. $0 \leq d < b$

Wilayah 2 (merah): . Di sini lingkaran seperempat memotong persegi panjang di sepanjang tepi atas dan bawah. $b \leq d \leq a$

Wilayah 3 (biru): . Lingkaran seperempat memotong persegi panjang di sepanjang tepi atas dan kanan. $a < d \leq \sqrt{a^2 + b^2}$

Berikut adalah gambar, di mana kita menggambar contoh radius dari masing-masing dari ketiga jenis. Persegi panjang didefinisikan oleh , . Peta panas skala abu-abu dalam persegi panjang menunjukkan kepadatan mana area gelap memiliki kepadatan lebih tinggi dan area yang lebih terang memiliki kepadatan lebih kecil. Mengklik pada gambar akan membuka versi yang lebih besar. $a = 5$ $b = 4$ $f_a(z_1) f_b(z_2) \rd z_1 \rd z_2$

Beberapa kalkulus jelek

Untuk menghitung probabilitas, kita perlu melakukan beberapa kalkulus. Mari kita pertimbangkan masing-masing daerah secara bergantian dan kita akan melihat bahwa integral yang sama akan muncul. Integral ini memiliki bentuk tertutup, meskipun tidak terlalu cantik.

Wilayah 1 : . $0 \leq d < b$

P (D \leq d) = \int_{0}^{d} \int_{0}^{\sqrt{d^{2} - y^{2}}} f_{b} (y) f_{a} (x) d x d y = \int_{0}^{d} f_{b} (y) \int_{0}^{\sqrt{d^{2} - y^{2}}} f_{a} (x) d x d y .

$\newcommand{\radius}{\sqrt{d^2 - y^2}} \Pr(D \leq d) = \int_0^d \int_0^{\radius} f_b(y) f_a(x) \rd x \rd y = \int_0^d f_b(y) \int_0^{\radius} f_a(x) \rd x \rd y \>.$

Sekarang, integral integral menghasilkan . Jadi, kita dibiarkan menghitung integral dari bentuk di mana dalam kasus ini bunga . Penangkal integrand adalah $\frac{1}{a^2}\radius (2 a - \radius)$

G (c) - G (0) = \int_{0}^{c} (b - y) \sqrt{d^{2} - y^{2}} (2 a - \sqrt{d^{2} - y^{2}}) d y,

$G(c) - G(0) = \int_0^c (b - y) \radius (2a - \radius) \rd y \> ,$

c = d

$c = d$

\begin{aligned} G (y) & = \int (b - y) \sqrt{d^{2} - y^{2}} (2 a - \sqrt{d^{2} - y^{2}}) d y \\ = \frac{a}{3} \sqrt{d^{2} - y^{2}} (y (3 b - 2 y) + 2 d^{2}) \\ + a b d^{2} \tan^{- 1} (\frac{y}{\sqrt{d^{2} - y^{2}}}) - b d^{2} y \\ + \frac{b y^{3}}{3} + \frac{(d y)^{2}}{2} - \frac{y^{4}}{4} . \end{aligned}

$\begin{align*} G(y) &= \int (b - y) \radius (2a - \radius) \rd y \\ &= \frac{a}{3} \radius ( y (3 b - 2 y) + 2 d^2) \\ &\quad + \,a b d^2 \tan^{-1}\Big(\frac{y}{{\scriptstyle \radius}}\Big) - b d^2 y \\ &\quad + \,\frac{b y^3}{3} + \frac{(d y)^2}{2} - \frac{y^4}{4} \> . \end{align*}$

Dari sini kita dapatkan . $\Pr(D \leq d) = \frac{2}{a^2 b^2} (G(d) - G(0))$

Wilayah 2 : . $b \leq d \leq a$

P (D \leq d) = \frac{2}{a^{2} b^{2}} (G (b) - G (0)),

$\Pr(D \leq d) = \frac{2}{a^2 b^2} (G(b) - G(0)) \>,$ dengan alasan yang sama seperti untuk Wilayah 1, kecuali sekarang kita harus mengintegrasikan sepanjang sumbu sampai ke bukan hanya .

y

$y$

b

$b$

d

$d$

Wilayah 3 : . $a < d \leq \sqrt{a^2 + b^2}$

\begin{aligned} P (D \leq d) & = \int_{0}^{\sqrt{d^{2} - a^{2}}} f_{b} (y) d y + \int_{\sqrt{d^{2} - a^{2}}}^{b} f_{b} (y) \int_{0}^{\sqrt{d^{2} - y^{2}}} f_{a} (x) d x d y \\ = F_{b} (\sqrt{d^{2} - a^{2}}) + \frac{2}{a^{2} b^{2}} (G (b) - G (\sqrt{d^{2} - a^{2}})) \end{aligned}

$\begin{align*} \Pr(D \leq d) &= \int_0^\sqrt{d^2-a^2} f_b(y)\rd y + \int_{\sqrt{d^2-a^2}}^b f_b(y) \int_{0}^\radius f_a(x) \rd x \rd y \\ &= F_b(\sqrt{d^2-a^2}) + \frac{2}{a^2 b^2} (G(b) - G(\sqrt{d^2-a^2})) \end{align*}$

Di bawah ini adalah simulasi 20.000 titik di mana kami memplot distribusi empiris sebagai titik abu-abu dan distribusi teoretis sebagai garis, diwarnai sesuai dengan wilayah tertentu yang berlaku.

Cdf empiris dan teoretis

Dari simulasi yang sama, di bawah ini kami plot 100 pasang poin pertama dan menarik garis di antara mereka. Masing-masing diwarnai sesuai dengan jarak antara sepasang titik dan wilayah mana dari jarak ini.

Sampel acak poin

Jumlah pasangan poin yang diharapkan dalam jarak hanyalah dengan linearitas harapan. $d$

E [ξ] = (\binom{n}{2}) P (D \leq d),

$\mathbb E[\xi] = {n \choose 2} \Pr(D \leq d) \>,$

— kardinal
sumber

+1. Kerja bagus! Akan sangat bagus untuk melihat jawaban yang diungkapkan dalam hal sifat geometris intrinsik dari persegi panjang: ia harus bergantung pada hal-hal seperti area, perimeter, dan konfigurasi keempat sudutnya. (Literatur - yang saya lihat direferensikan tetapi belum memiliki akses - tampaknya berfokus pada domain dengan batas-batas yang halus.)

— whuber

Terima kasih. Itu saran yang bagus. Saya akan mencoba membuat penyederhanaan dan reformulasi tersebut.

— kardinal

@ kardinal Kerja yang sangat bagus! Saya terkejut bahwa Anda benar-benar menjawab masalah bahkan dengan cdf terperinci. Terima kasih.

— zhouzhuojie

Jika titik benar-benar terdistribusi secara seragam, yaitu dalam pola yang diketahui tetap, maka untuk jarak apa pun d, Anda dapat dengan mudah mengulang semua pasangan dan menghitung yang berada dalam jarak tersebut. Probabilitas Anda adalah (angka itu / n).

Jika Anda memiliki kebebasan tambahan untuk memilih bagaimana n poin didistribusikan / dipetik, maka ini adalah versi persegi panjang dari paradoks Bertrand . Halaman itu menunjukkan sejumlah cara untuk menjawab pertanyaan ini berdasarkan pada bagaimana Anda mendistribusikan poin Anda.

— cape1232
sumber

Pertanyaannya adalah tentang distribusi untuk titik-titik yang didistribusikan secara seragam: ini adalah variabel acak, bukan "pola yang diketahui pasti", dan seseorang tidak bisa begitu saja mengulangi pasangannya!

— whuber

Saya pikir Anda mungkin salah memahami pertanyaan OP. Juga, distribusi yang diinginkan didefinisikan secara jelas dalam pertanyaan. Komentar saya kepada OP mengisyaratkan bahwa sudah ada solusi pada jaringan SE untuk pertanyaan ini, maka yang ini kemungkinan besar bisa ditutup. :)

— kardinal

Apakah Anda yakin ada solusi pada matematika. SE, kardinal? Ini adalah masalah yang sulit karena efek tepi. Mungkin ada solusi pada torus yang rata.

— whuber

@whuber: Solusi? Tidak. Tapi, saya hampir yakin pertanyaan ini muncul. :) Saya akan melihat apakah saya dapat menemukannya. Bagaimanapun, saya tidak yakin masalah ini sangat sulit, bahkan dalam kasus ini. Saya yakin Anda dapat menggunakan terjemahan invarian untuk menyederhanakannya. Tapi, saya belum mengerjakan detailnya.

— kardinal

@ kardinal Terima kasih. Sebenarnya saya telah memeriksa semua pertanyaan di Math.SE, tetapi saya masih belum dapat menemukan beberapa masalah yang dekat dengannya.

— zhouzhuojie