Banyak PDF berkisar dari minus hingga tak terhingga positif, namun beberapa cara didefinisikan dan beberapa tidak. Sifat umum apa yang membuat beberapa dapat dihitung?
Banyak PDF berkisar dari minus hingga tak terhingga positif, namun beberapa cara didefinisikan dan beberapa tidak. Sifat umum apa yang membuat beberapa dapat dihitung?
Jawaban:
Rata-rata distribusi didefinisikan dalam bentuk integral (saya akan menulisnya seolah-olah untuk distribusi kontinu - sebagai integral Riemann, katakan - tetapi masalah ini berlaku lebih umum; kita dapat melanjutkan ke integrasi Stieltjes atau Lebesgue untuk berurusan dengan ini dengan benar dan sekaligus):
Tapi apa artinya itu? Secara efektif ini adalah singkatan
atau
(meskipun Anda bisa memecahkannya di mana saja tidak hanya pada 0)
Masalahnya muncul ketika batas integral tersebut tidak terbatas.
Jadi misalnya, perhatikan kerapatan Cauchy standar, yang sebanding dengan ... perhatikan bahwa
biarkan , jadi d u = 2 x
yang tidak terbatas. Batas di bagian bawah juga tidak terbatas; harapan itu dengan demikian tidak terdefinisi.
Atau jika kita memiliki sebagai variabel acak nilai absolut dari Cauchy standar, seluruh ekspektasinya akan sebanding dengan batas yang baru saja kita lihat (yaitu ).
Di sisi lain, beberapa kepadatan lainnya terus berlanjut "hingga tak terbatas" tetapi integral mereka memang memiliki batas.
Jawaban lainnya baik, tetapi mungkin tidak meyakinkan semua orang, terutama orang yang melihat distribusi Cauchy (dengan ) dan mengatakan itu masih secara intuitif jelas bahwa rata-rata harus nol.
Alasan jawaban intuitif tidak benar dari perspektif matematika adalah karena teorema penataan ulang Riemann (video) .
Secara efektif apa yang Anda lakukan ketika Anda melihat Cauchy dan mengatakan bahwa rata-rata "harus nol" adalah bahwa Anda membagi "pusat" menjadi nol, dan kemudian mengklaim momen keseimbangan dua ukuran. Atau dengan kata lain, Anda secara implisit melakukan jumlah tak terbatas dengan "setengah" istilah positif (momen di setiap titik di kanan) dan "setengah" istilah negatif (momen di setiap titik di kiri) dan mengklaimnya jumlah ke nol. (Untuk yang berpikiran teknis: )
Teorema penataan ulang Riemann mengatakan bahwa jenis jumlah tak terbatas ini (satu dengan istilah positif dan negatif) hanya konsisten jika dua seri (hanya istilah positif dan hanya negatif) masing-masing konvergen ketika diambil secara independen. Jika kedua belah pihak (positif dan negatif) berbeda dengan mereka sendiri, maka Anda dapat membuat urutan penjumlahan dari istilah-istilah sedemikian sehingga menjumlahkan ke nomor berapa pun . (Video di atas, mulai dari 6:50)
Jadi, ya, jika Anda melakukan penjumlahan secara seimbang dari 0, saat-saat pertama dari distribusi Cauchy dibatalkan. Namun, definisi (standar) rata-rata tidak menegakkan urutan penjumlahan ini. Anda harus dapat menjumlahkan momen dalam urutan apa pun dan membuatnya sama-sama valid. Oleh karena itu, rata-rata distribusi Cauchy tidak terdefinisi - dengan memilih dengan bijak bagaimana Anda menjumlahkan momen, Anda dapat menjadikannya "seimbang" (atau tidak) pada titik apa pun secara praktis.
Jadi untuk membuat rata-rata distribusi didefinisikan, dua momen integral perlu masing-masing secara konvergen (terbatas) di sekitar mean yang diusulkan (yang, ketika Anda , benar-benar hanyalah cara lain untuk mengatakan bahwa integral penuh ( ) harus konvergen). Jika ekornya "gemuk" cukup untuk membuat momen untuk satu sisi tak terbatas, Anda sudah selesai. Anda tidak dapat menyeimbangkannya dengan momen tak terbatas di sisi lain.
Saya harus menyebutkan bahwa perilaku "kontra intuitif" dari hal-hal seperti distribusi Cauchy sepenuhnya karena masalah ketika berpikir tentang ketakterhinggaan. Ambil distribusi Cauchy dan potong ekornya - bahkan secara sewenang-wenang, seperti pada plus / minus nomor xkcd - dan (setelah dinormalisasi ulang) Anda tiba-tiba mendapatkan sesuatu yang berperilaku baik dan memiliki rata-rata yang ditentukan. Bukan ekor gemuk di dalam dan dari diri mereka sendiri yang menjadi masalah, melainkan bagaimana ekor itu berperilaku saat Anda mendekati tak terbatas.
Jenderal Abrial dan Glen_b memiliki jawaban sempurna. Saya hanya ingin menambahkan demo kecil untuk menunjukkan kepada Anda rata-rata distribusi Cauchy tidak ada / tidak konvergen.
Dalam percobaan berikut, Anda akan melihat, bahkan jika Anda mendapatkan sampel besar dan menghitung rata-rata empiris dari sampel, jumlahnya cukup berbeda dari eksperimen ke eksperimen.
set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))
Anda dapat mengamati bahwa kami memiliki percobaan, dan dalam setiap percobaan, kami mengambil sampel poin dari dua distribusi, dengan ukuran sampel sebesar itu, rata-rata empiris pada eksperimen yang berbeda harus cukup dekat dengan rata-rata sebenarnya. Hasilnya menunjukkan distribusi Cauchy tidak memiliki rata-rata konvergen, tetapi distribusi normal memiliki.1 × 10 5
EDIT:
Seperti @ mark999 disebutkan dalam obrolan, kita harus berdebat bahwa dua distribusi yang digunakan dalam percobaan memiliki "varians" yang serupa (alasan saya menggunakan kutipan adalah karena varian distribusi Cauchy juga tidak terdefinisi.). Inilah pembenarannya: PDF mereka serupa.
Perhatikan bahwa, dengan melihat PDF distribusi Cauchy, kami menduga itu adalah , tetapi dari percobaan yang dapat kita lihat, itu tidak ada. Itulah inti dari demo.
curve(dnorm, -8,8)
curve(dcauchy, -8,8)
Menurut definisi Lebesgue-Stieltjes integral, rerata ada jika:
https://en.wikipedia.org/wiki/Moment_(mathematics)#Significance_of_the_moments
Distribusi Cauchy adalah bentuk penyamaran dari distribusi yang sangat mendasar, yaitu distribusi seragam pada sebuah lingkaran. Dalam rumus, probabilitas sangat kecil adalah , di mana adalah koordinat sudut. Probabilitas (atau ukuran) dari busur adalah . Ini berbeda dari distribusi seragam , meskipun ukurannya memang sama untuk busur yang tidak mengandung . Misalnya, pada lengkungan dari berlawanan arah jarum jam ke , rata-rata distribusi pada lingkaran adalah. Tetapi rata-rata distribusi seragam pada gabungan yang sesuai dari dua interval terpisah, masing-masing panjang , adalah nol.
Karena distribusi pada lingkaran secara simetris berputar, tidak mungkin ada rata-rata, median atau mode pada lingkaran. Demikian pula, momen yang lebih tinggi, seperti varians, tidak masuk akal. Distribusi ini muncul secara alami dalam banyak konteks. Sebagai contoh, proyek saya saat ini melibatkan gambar mikroskop dari jaringan kanker. Objek yang sangat banyak dalam gambar tidak simetris dan "arah" dapat ditetapkan untuk masing-masing. Hipotesis nol yang jelas adalah bahwa arah ini terdistribusi secara seragam.
Untuk menyamarkan kesederhanaan, misalkan menjadi lingkaran satuan standar, dan biarkan . Kami mendefinisikan sebagai fungsi dengan proyeksi stereografis lingkaran dari ke -aksi. Rumusnya adalah . Membedakan, kami menemukan . Karena itu, probabilitas sangat kecil adalah , bentuk distribusi Cauchy yang biasa, dan "Hei, presto!", Kesederhanaan menjadi sakit kepala, membutuhkan perawatan oleh seluk-beluk teori integrasi. p=(0,1
Dalam , kita dapat mengabaikan ketiadaan (dengan kata lain, mengembalikan ) untuk pertimbangan apa pun seperti mean atau momen pesanan lebih tinggi, karena probabilitas dari (ukurannya) adalah nol. Jadi karena itu, tidak adanya rata-rata dan momen-momen yang lebih tinggi mengarah ke garis nyata. Namun, sekarang ada titik khusus, yaitu , yang memetakan ke bawah proyeksi stereografi dan ini menjadi median dan mode distribusi Cauchy.pp∈ S 1 p-p=(0,-1)0∈ R