Jadi pertanyaan ini agak berantakan, tetapi saya akan menyertakan grafik warna-warni untuk menebusnya! Pertama Latar Belakang kemudian Pertanyaan.

Latar Belakang

Katakanlah Anda memiliki distribusi multinomial -dimensi dengan probailit yang sama dengan kategori . Biarkan menjadi hitungan yang dinormalisasi ( ) dari distribusi itu, yaitu: $n$ $n$ $\pi = (\pi_1, \ldots, \pi_n)$ $c$

(c_{1}, \dots, c_{n}) \sim Multinomial (1 / n, \dots, 1 / n) π_{i} = \frac{c_{i}}{n}

$(c_1, \ldots, c_n) \sim \text{Multinomial}(1/n, \ldots, 1/n) \\ \pi_i = {c_i \over n}$

Sekarang distribusi over memiliki dukungan atas -simpleks tetapi dengan langkah-langkah yang terpisah. Misalnya, dengan distribusi ini memiliki dukungan berikut (titik merah): $\pi$ $n$ $n = 3$

masukkan deskripsi gambar di sini

Distribusi lain dengan dukungan serupa adalah distribusi -dimensi , yaitu distribusi yang seragam pada unit simplex. Misalnya, berikut ini undian acak dari 3-dimesional : $n$ $\text{Dirichlet}(1, \ldots, 1)$ $\text{Dirichlet}(1, 1, 1)$

masukkan deskripsi gambar di sini

Sekarang saya punya ide bahwa distribusi dari distribusi dapat dikarakteristikkan sebagai gambar dari yang didiskritkan ke dukungan diskrit dari . Diskritisasi yang ada dalam pikiran saya (dan yang tampaknya bekerja dengan baik) adalah mengambil setiap titik dalam simpleks dan "membulatkannya" ke titik terdekat yang ada dalam dukungan . Untuk simpleks 3 dimensi Anda mendapatkan partisi berikut ini di mana titik di setiap area berwarna harus "membulatkan" ke titik merah terdekat: $\pi$ $\text{Multinomial}(1/n, \ldots, 1/n)$ $\text{Dirichlet}(1, \ldots, 1)$ $\pi$ $\pi$

masukkan deskripsi gambar di sini

Karena distribusi Dirichlet seragam, kerapatan / probabilitas yang dihasilkan untuk masing-masing titik sebanding dengan luas / volume yang "dibulatkan" ke setiap titik. Untuk kasus dua dimensi dan tiga dimensi probabilitas ini adalah:

masukkan deskripsi gambar di sini ( probabilitas ini berasal dari simulasi Monte Carlo )

Jadi sepertinya, setidaknya untuk dimensi 2 dan 3, distribusi probabilitas yang dihasilkan dari diskritisasi dengan cara khusus ini sama dengan distribusi probabilitas untuk . Itu adalah hasil normalisasi dari distribusi . Saya juga sudah mencoba dengan 4-dimensi dan sepertinya berfungsi di sana. $\text{Dirichlet}(1, \ldots, 1)$ $\pi$ $\text{Multinomial}(1/n, \ldots, 1/n)$

Pertanyaan

Jadi pertanyaan utama saya adalah:

Ketika mendiskreditkan Dirichlet yang seragam dengan cara khusus ini, apakah hubungannya dengan berlaku untuk dimensi selanjutnya? Apakah hubungannya sama sekali? (Saya hanya mencoba ini menggunakan simulasi Monte Carlo ...) $\text{Multinomial}(1/n, \ldots, 1/n)$

Lebih lanjut saya bertanya-tanya:

Jika hubungan ini berlaku, apakah ini merupakan hasil yang diketahui? Dan adakah sumber yang bisa saya kutip untuk ini?
Jika diskritisasi seragam Dirichlet ini tidak memiliki hubungan dengan Multinomial. Apakah ada konstruksi serupa yang dimiliki?

Beberapa konteks

Alasan saya untuk mengajukan pertanyaan ini adalah karena saya melihat kesamaan antara Bootstrap non-parametrik dan Bootstrap Bayesian, dan kemudian ini muncul. Saya juga memperhatikan bahwa pola pada area berwarna pada simpleks 3-dimesi di atas terlihat seperti (dan seharusnya) diagram Voronoi. Salah satu cara (saya harap) Anda dapat memikirkan ini adalah sebagai urutan Pascal's Triangle / Simpex ( http://www.math.rutgers.edu/~erowland/pascalssimplices.html ). Di mana ukuran area berwarna mengikuti baris kedua Pascal's triangle dalam case 2-d, baris ketiga tetrahedron Pascal dalam case 3-d, dan seterusnya. Ini akan menjelaskan hubungan dengan distribusi multinomial, tapi di sini saya benar-benar di perairan dalam ...

— Rasmus Bååth
sumber

menyenangkan! (Seperti biasa.) Tapi saya kehilangan koneksi kaus kaki.

— Xi'an

Yah, saya mulai menggambar kaus kaki dengan pengganti. Tapi kemudian saya mulai berpikir tentang Bayesian Boostrap, satu hal mengarah ke yang lain, dan itulah bagaimana saya berakhir di sini :)

— Rasmus Bååth

@ Xi'an mungkin itu kaus kaki ketimbang anak anjing yang harus menjadi maskot Bayesian?

— Tim

Kedua distribusi tersebut berbeda untuk setiap . $n \geq 4$

Notasi

Saya akan mengubah skala simpleks Anda dengan faktor , sehingga titik-titik kisi memiliki koordinat bilangan bulat. Ini tidak mengubah apa pun, saya hanya berpikir itu membuat notasi sedikit kurang rumit. $n$

Misalkan adalah -simplex, diberikan sebagai cembung titik , ..., dalam . Dengan kata lain, ini adalah titik-titik di mana semua koordinat non-negatif, dan di mana koordinat dijumlahkan menjadi . $S$ $(n-1)$ $(n,0,\ldots,0)$ $(0,\ldots,0,n)$ $\mathbb R^{n}$ $n$

Misalkan menunjukkan himpunan titik kisi , yaitu titik-titik di di mana semua koordinat integral. $\Lambda$ $S$

Jika adalah titik kisi, kita membiarkan menunjukkan sel Voronoi -nya , didefinisikan sebagai titik-titik di yang lebih dekat ke daripada titik lain di . $P$ $V_P$ $S$ $P$ $\Lambda$

Kami menempatkan dua distribusi probabilitas yang dapat kami gunakan . Salah satunya adalah distribusi multinomial, di mana titik memiliki probabilitas . Yang lain kita akan memanggil model yang Dirichlet , dan memberikan kepada setiap probabilitas sebanding dengan volume . $\Lambda$ $(a_1, ..., a_n)$ $2^{-n} n!/(a_1! \cdots a_n!)$ $P \in \Lambda$ $V_P$

Pembenaran yang sangat informal

Saya mengklaim bahwa model multinomial dan model Dirichlet memberikan distribusi yang berbeda pada , setiap kali . $\Lambda$ $n \geq 4$

Untuk melihat ini, perhatikan case , dan titik dan . Saya mengklaim bahwa dan adalah kongruen melalui terjemahan oleh vektor . Ini berarti bahwa dan $n=4$ $A = (2,2,0,0)$ $B=(3,1,0,0)$ $V_A$ $V_B$ $(1,-1,0,0)$ $V_A$ $V_B$ memiliki volume yang sama, dan dengan demikian dan memiliki probabilitas yang sama dalam model Dirichlet. Di sisi lain, dalam model multinomial, mereka memiliki probabilitas yang berbeda ( Dan ), Dan selanjutnya distribusi tidak dapat sama. $A$ $B$ $2^{-4} \cdot 4!/(2!2!)$ $2^{-4} \cdot 4!/3!$

Fakta bahwa dan adalah kongruen mengikuti klaim yang masuk akal tetapi tidak jelas (dan agak kabur): $V_A$ $V_B$

Klaim yang masuk akal : Bentuk dan ukuran dari hanya dipengaruhi oleh "tetangga dekat" dari , (yaitu titik-titik di yang berbeda dari oleh vektor yang terlihat seperti , di mana dan mungkin ada di tempat lain) $V_P$ $P$ $\Lambda$ $P$ $(1,-1,0,\ldots,0)$ $1$ $-1$

Sangat mudah untuk melihat bahwa konfigurasi "tetangga dekat" dari dan adalah sama, dan kemudian mengikuti bahwa dan adalah kongruen. $A$ $B$ $V_A$ $V_B$

Dalam kasus , kita dapat memainkan game yang sama, dengan dan , sebagai contoh. $n \geq 5$ $A = (2,2,n-4,0,\ldots,0)$ $B=(3,1,n-4,0,\ldots,0)$

Saya tidak berpikir klaim ini sepenuhnya jelas, dan saya tidak akan membuktikannya, alih-alih strategi yang sedikit berbeda. Namun, saya pikir ini adalah jawaban yang lebih intuitif mengapa distribusi berbeda untuk . $n \geq 4$

Bukti yang kuat

Ambil dan seperti dalam justifikasi informal di atas. Kita hanya perlu membuktikan bahwa dan adalah kongruen. $A$ $B$ $V_A$ $V_B$

Diberi , kita akan mendefinisikan sebagai berikut: adalah himpunan titik-titik , yang $P = (p_1, \ldots, p_n) \in \Lambda$ $W_P$ $W_P$ $(x_1, \ldots, x_n) \in S$ . (Dalam cara yang lebih mudah dicerna: Let . adalah himpunan titik-titik yang perbedaan antara tertinggi dan terendah kurang dari 1.) $\max_{1 \leq i \leq n} (a_i - p_i) - \min_{1 \leq i \leq n} (a_i - p_i) < 1$ $v_i = a_i - p_i$ $W_P$ $v_i$

Kami akan menunjukkan bahwa . $V_P = W_P$

Langkah 1

Klaim: . $V_P \subseteq W_P$

Ini cukup mudah: Misalkan $X = (x_1, \ldots, x_n)$ tidak dalam . Biarkan , dan anggap (tanpa kehilangan sifat umum) bahwa , . $W_P$ $v_i = x_i - p_i$ $v_1 = \max_{1\leq i\leq n} v_i$ $v_2 = \min_{1\leq i\leq n} v_i$ Karena , kita juga tahu bahwa . $v_1 - v_2 \geq 1$ $\sum_{i=1}^n v_i = 0$ $v_1 > 0 > v_2$

Biarkan sekarang . Karena dan keduanya memiliki koordinat non-negatif, begitu juga , dan itu mengikuti , dan begitu juga . Di sisi lain, $Q = (p_1 + 1, p_2 - 1, p_3, \ldots, p_n)$ $P$ $X$ $Q$ $Q \in S$ $Q \in \Lambda$ . Dengan demikian, setidaknya sebagai dekat dengan untuk , sehingga . Ini menunjukkan (dengan mengambil pelengkap) itu $\mathrm{dist}^2(X, P) - \mathrm{dist}^2(X, Q) = v_1^2 + v_2^2 - (1-v_1)^2 - (1+v_2)^2 = -2 + 2(v_1 - v2) \geq 0$ $X$ $Q$ $P$ $X \not\in V_P$ . $V_p \subseteq W_P$

Langkah 2

Klaim : The yang berpasangan menguraikan. $W_P$

Misalkan sebaliknya. Mari dan menjadi titik berbeda dalam , dan membiarkan . Karena dan berbeda dan keduanya dalam , harus ada satu indeks mana , dan satu di mana $P=(p_1,\ldots, p_n)$ $Q = (q_1,\ldots,q_n)$ $\Lambda$ $X \in W_P \cap W_Q$ $P$ $Q$ $\Lambda$ $i$ $p_i \geq q_i + 1$ . Tanpa kehilangan sifat umum, kita mengasumsikan bahwa , dan . Mengatur ulang dan menambahkan bersama, kita mendapatkan . $p_i \leq q_i - 1$ $p_1 \geq q_1 + 1$ $p_2 \leq q_2 - 1$ $q_1 - p_1 + p_2 - q_2 \geq 2$

Pertimbangkan sekarang angka dan . Dari fakta bahwa , kita memiliki . Demikian pula, menyiratkan bahwa . Menambahkan ini bersama-sama, kita mendapatkan $x_1$ $x_2$ $X \in W_P$ $x_1 - p_1 - (x_2 - p_2) < 1$ $X \in W_Q$ $x_2 - q_2 - (x_1 - q_1) < 1$ , dan kami memiliki kontradiksi. $q_1 - p_1 + p_2 - q_2 < 2$

Langkah 3

Kami telah menunjukkan bahwa , dan bahwa yang menguraikan. The penutup hingga satu set ukuran nol, dan itu berikut bahwa (sampai satu set ukuran nol). [Karena dan keduanya terbuka, kita benar-benar memiliki persis, tapi ini tidak penting.] $V_P \subseteq W_P$ $W_P$ $V_P$ $S$ $W_P = V_P$ $W_P$ $V_P$ $W_P = V_P$

Sekarang, kita hampir selesai. Pertimbangkan titik dan . Sangat mudah untuk melihat bahwa dan adalah kongruen dan terjemahan satu sama lain: satu-satunya cara mereka bisa berbeda, adalah jika batas (selain wajah-wajah di mana $A = (2,2,n-4,0,\ldots,0)$ $B = (3,1,n-4,0,\ldots,0)$ $W_A$ $W_B$ $S$ $A$ dan keduanya berbohong) akan `` memotong '' baik atau tetapi tidak yang lain. Tapi untuk mencapai seperti bagian dari batas , kita akan perlu mengubah satu koordinat dari atau dengan setidaknya 1, yang akan cukup untuk jaminan untuk membawa kita keluar dari dan pula. Jadi, meskipun memang terlihat berbeda dari titik pandang dan , perbedaannya terlalu jauh untuk diambil oleh definisi dan , dan dengan demikian $B$ $W_A$ $W_B$ $S$ $A$ $B$ $W_A$ $W_B$ $S$ $A$ $B$ $W_A$ $W_B$ dan adalah kongruen. $W_A$ $W_B$

Maka mengikuti bahwa dan memiliki volume yang sama, dan dengan demikian model Dirichlet memberi mereka probabilitas yang sama, meskipun mereka memiliki probabilitas yang berbeda dalam model multinomial. $V_A$ $V_B$

— ZH Liu
sumber

Wow, teliti! Terima kasih! Jadi korespondensi kecil yang saya harapkan adalah kebetulan, saya kira ...

— Rasmus Bååth

Dapatkah Multinomial (1 / n,…, 1 / n) dikarakteristikkan sebagai Dirichlet yang diskrit (1, .., 1)?

Latar Belakang

Pertanyaan

Beberapa konteks

Notasi

Pembenaran yang sangat informal

Bukti yang kuat

Langkah 1

Langkah 2

Langkah 3