Apakah ada distribusi berbentuk dataran tinggi?


30

Saya mencari distribusi di mana kepadatan probabilitas berkurang dengan cepat setelah beberapa titik menjauh dari rata-rata, atau dengan kata-kata saya sendiri "distribusi berbentuk dataran tinggi".

Sesuatu di antara Gaussian dan seragam.


8
Anda bisa menjumlahkan RV Gaussian dan RV seragam.
StrongBad

3
Seseorang kadang mendengar tentang apa yang disebut distribusi platykurtic .
JM bukan ahli statistik

Jawaban:


53

Anda mungkin mencari distribusi yang dikenal dengan nama normal umum (versi 1) , distribusi Subbotin , atau distribusi daya eksponensial. Ini ditentukan oleh lokasi , skala dan bentuk dengan pdfμσβ

β2σΓ(1/β)exp[-(|x-μ|σ)β]

seperti yang Anda perhatikan, untuk itu menyerupai dan menyatu dengan distribusi Laplace, dengan \ beta = 2 konvergennya menjadi normal, dan ketika \ beta = \ infty ke distribusi seragam.β=1β=2β=

masukkan deskripsi gambar di sini

Jika Anda mencari perangkat lunak yang telah mengimplementasikannya, Anda dapat memeriksa normalpperpustakaan untuk R (Mineo dan Ruggieri, 2005). Yang menyenangkan dari paket ini adalah, antara lain, ia mengimplementasikan regresi dengan kesalahan umum yang didistribusikan secara umum, yaitu meminimalkan norma .L.hal


Mineo, AM, & Ruggieri, M. (2005). Alat perangkat lunak untuk distribusi daya eksponensial: Paket normalp. Jurnal Perangkat Lunak Statistik, 12 (4), 1-24.


20

Komentar @ StrongBad adalah saran yang sangat bagus. Jumlah RV dan gaussian RV yang seragam dapat memberikan apa yang Anda cari jika Anda memilih parameter dengan benar. Dan itu sebenarnya memiliki solusi bentuk tertutup yang cukup bagus.

Pdf dari variabel ini diberikan oleh ekspresi:

14Sebuah[erf(x+Sebuahσ2)-erf(x-Sebuahσ2)]

Sebuah adalah "jari-jari" dari RV seragam rata-rata nol. adalah standar deviasi dari RV gaussian rata-rata.σ

PDF


3
Referensi: Bhattacharjee, GP, Pandit, SNN, dan Mohan, R. 1963. Rantai dimensi yang melibatkan distribusi kesalahan persegi panjang dan normal. Technometrics, 5, 404-406.
Tim

15

Ada jumlah tak terbatas dari distribusi "berbentuk dataran tinggi".

Apakah Anda mencari sesuatu yang lebih spesifik daripada "di antara Gaussian dan seragam"? Itu agak kabur.

Ini salah satu yang mudah: Anda selalu bisa menempel setengah normal di setiap ujung seragam:

Kepadatan dengan pusat seragam dan ekor Gaussian

Anda dapat mengontrol "lebar" seragam relatif terhadap skala normal sehingga Anda dapat memiliki dataran tinggi yang lebih luas atau lebih sempit, memberikan seluruh kelas distribusi, termasuk Gaussian dan seragam sebagai pembatas kasus.

Kepadatannya adalah:

h2πσe-12σ2(x-μ+w/2)2sayaxμ-w/2+h2πσsayaμ-w/2<xμ+w/2+h2πσe-12σ2(x-μ-w/2)2sayax>μ+w/2

dimana h=11+w/(2πσ)

Sebagai untuk fixed w , kita mendekati seragam pada ( μ - w / 2 , μ + w / 2 ) dan sebagai w 0 untuk fixed σ kita mendekati N ( μ , σ 2 ) .σ0w(μ-w/2,μ+w/2)w0σN(μ,σ2)

Berikut adalah beberapa contoh (dengan dalam setiap kasus):μ=0

Plot berbagai contoh seragam berekor Gaussian ini

Kita mungkin menyebut kepadatan ini sebagai "seragam berekor Gaussian".


1
Ach! Saya suka menghadiri bola resmi mengenakan seragam ekor Gausian! ;)
Alexis

7

Lihat distribusi "Menara Iblis" saya di sini [1]:

f(x)=0,3334|x|<0,9399
f(x)=0,2945/x20,9399|x|<2.3242
f(x)=02.3242|x|

Fungsi kepadatan menara iblis dengan bagian atas rata, sisi cembung, terpotong secara ekstrem

Distribusi "slip-dress" bahkan lebih menarik.

Sangat mudah untuk membangun distribusi yang memiliki bentuk apa pun yang Anda inginkan.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Am. Stat. 68 (3): 191–195. doi: 10.1080 / 00031305.2014.917055
akses publik pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


Hai Peter - Saya mengambil kebebasan memberikan fungsi dan memasukkan gambar serta memberikan referensi lengkap. (Jika ingatanku, saya pikir Kendall dan Stuart memberikan rincian dari sanggahan yang sama dalam teks klasik mereka. Jika saya ingat dengan benar - sudah lama - saya percaya mereka juga membahas bahwa itu bukan sifat berekor berat)
Glen_b -Reinstate Monica

Terima kasih, Glen_b. Saya tidak pernah mengatakan kurtosis mengukur apa yang diukur oleh angka-angka indeks ekor. Sebaliknya, artikel saya membuktikan kurtosis adalah, untuk kelas distribusi yang sangat luas, hampir sama dengan E (Z ^ 4 * I (| Z |> 1)). Dengan demikian, kurtosis dengan jelas tidak memberi tahu Anda tentang 'puncak', yang biasanya ditemukan dalam kisaran {Z: | Z | <1}. Sebaliknya, sebagian besar ditentukan oleh ekor. Sebut saja E (Z ^ 4 * I (| Z |> 1)) jika istilah "heavy-tailedness" memiliki arti lain.
Peter Westfall

Juga, @Glen_b indeks ekor mana yang Anda maksud? Ada banyak sekali. Penyeberangan ekor tidak mendefinisikan "tailedness" dengan benar. Menurut beberapa definisi tailing cross tail, N (0,1) lebih "berekor berat" daripada 0,9999 * U (-1,1) + .0001 * U (-1000,1000), meskipun yang terakhir adalah ekornya jelas lebih berat, meski memiliki ekor yang terbatas. Dan, BTW, yang terakhir memiliki kurtosis yang sangat tinggi, tidak seperti N (0,1).
Peter Westfall

Saya tidak dapat menemukan saya mengatakan "indeks ekor" di mana pun di komentar saya; Saya tidak yakin apa yang Anda maksud di sana ketika Anda mengatakan "indeks ekor mana yang Anda maksud". Jika yang Anda maksudkan sedikit tentang kekejaman berat, hal terbaik untuk dilakukan adalah memeriksa apa yang sebenarnya dikatakan Kendall dan Stuart; Saya percaya di sana mereka benar-benar membandingkan rasio kepadatan asimptotik untuk variabel standar simetris, tetapi mungkin fungsi yang bertahan mungkin; intinya adalah milik mereka, bukan milikku
Glen_b -Reinstate Monica

Aneh. Bagaimanapun, Kendall dan Stuart salah. Kurtosis jelas ukuran berat ekor seperti yang dibuktikan oleh teorema saya.
Peter Westfall

5

f(x)

f(x)=k11+x2Sebuahuntuk xR

dimana:

  • Sebuah
  • kk=Sebuahπdosa(π2Sebuah)

Sebuah

masukkan deskripsi gambar di sini

.

Sebuah

masukkan deskripsi gambar di sini


3

Satu lagi ( EDIT : Saya menyederhanakannya sekarang. EDIT2 : Saya menyederhanakannya lebih jauh, meskipun sekarang gambar tidak benar-benar mencerminkan persamaan yang tepat ini):

f(x)=13αlog(tongkat pendek(αSebuah)+tongkat pendek(αx)tongkat pendek(αb)+tongkat pendek(αx))

log(tongkat pendek(x))x

SebuahlhalhSebuahSebuah=2b=1


Berikut ini beberapa contoh kode dalam R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fadalah distribusi kami. Mari kita plot untuk urutanx

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Output konsol:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

Dan plot:

Distribusi saya berdasarkan log cosh

Anda dapat mengubah adan b, kira-kira awal dan akhir lereng masing-masing, tetapi kemudian diperlukan normalisasi lebih lanjut, dan saya tidak menghitungnya (itu sebabnya saya menggunakan a = 2dan b = 1dalam plot).


2

Jika Anda mencari sesuatu yang sangat sederhana, dengan dataran tinggi tengah dan sisi-sisi distribusi segitiga, Anda dapat misalnya menggabungkan distribusi segitiga N, N tergantung pada rasio yang diinginkan antara dataran tinggi dan keturunan. Mengapa segitiga, karena fungsi pengambilan sampelnya sudah ada di sebagian besar bahasa. Anda mengurutkan secara acak dari salah satunya.

Dalam R yang akan memberi:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

masukkan deskripsi gambar di sini masukkan deskripsi gambar di sini


2

Inilah yang cantik: produk dari dua fungsi logistik.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Ini memiliki manfaat tidak menjadi bagian.

B mengatur lebar dan A mengatur kecuraman drop off. Di bawah ini ditunjukkan B = 1: 6 dengan A = 2. Catatan: Saya belum meluangkan waktu untuk mencari cara menormalkan ini dengan benar.

Distribusi dataran tinggi

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.