Bisakah seseorang menawarkan contoh distribusi unimodal yang memiliki kemiringan nol tetapi yang tidak simetris?


31

Pada Mei 2010, pengguna Wikipedia Mcorazao menambahkan kalimat pada artikel skewness bahwa "Nilai nol menunjukkan bahwa nilai-nilai tersebut didistribusikan secara merata di kedua sisi rata-rata, biasanya tetapi tidak selalu menyiratkan distribusi simetris." Namun, halaman wiki tidak memiliki contoh distribusi aktual yang melanggar aturan ini. Googling "contoh distribusi asimetris dengan nol skewness" juga tidak memberikan contoh nyata, setidaknya dalam 20 hasil pertama.

Menggunakan definisi bahwa kemiringan dihitung oleh , dan R rumusE[(Xμσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Saya dapat membangun distribusi kecil yang sewenang-wenang untuk membuat kemiringan rendah. Misalnya saja distribusi

x = c(1, 3.122, 5, 4, 1.1) 

menghasilkan kemiringan . Tapi ini sampel kecil dan apalagi penyimpangan dari simetri tidak besar. Jadi, mungkinkah membangun distribusi yang lebih besar dengan satu puncak yang sangat asimetris tetapi masih memiliki kemiringan hampir nol?5.64947105


3
Apakah Anda ingin distribusi menjadi unimodal atau tidak? Judulnya mengatakan demikian, tetapi teksnya hampir tidak menyebutkan poin ini.
Dilip Sarwate

@Dilip Ya, saya akan merasa lebih menarik jika distribusinya adalah unimodal, karena kemiringan, sebagai momen sentral, tidak benar-benar masuk akal sebaliknya.
Andy McKenzie

Jawaban:


28

Pertimbangkan distribusi diskrit. Salah satu yang didukung pada nilai x 1 , x 2 , ... , x k ditentukan oleh probabilitas non-negatif p 1 , p 2 , ... , p k tunduk pada kondisi yang (a) dijumlahkan menjadi 1 dan (b) koefisien kemiringan sama dengan 0 (yang setara dengan momen pusat ketiga menjadi nol). Itu menyisakan k - 2 derajat kebebasan (dalam arti penyelesaian persamaan, bukan statistik!). Kita bisa berharap menemukan solusi yang unimodal.kx1,x2,...,xkhal1,hal2,...,halkk-2

Untuk mempermudah pencarian contoh, saya mencari solusi yang didukung oleh vektor simetris kecil dengan mode unik pada 0 , rata-rata nol, dan nol kemiringan . Salah satu solusi tersebut adalah ( p 1 , ... , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 ,x=(-3,-2,-1,0,1,2,3)0 .(hal1,...,hal7)=(1396,3286,9586,47386,8781,3930,1235)/75600

Fungsi probabilitas

Anda dapat melihatnya asimetris.

Inilah solusi asimetris yang lebih jelas dengan (yang asimetris) dan p = ( 1 , 18 , 72 , 13 , 4 ) / 108 :x=(-3,-1,0,1,2)hal=(1,18,72,13,4)/108

Fungsi probabilitas 2

Sekarang sudah jelas apa yang terjadi: karena mean sama dengan , nilai negatif berkontribusi ( - 3 ) 3 = - 27 dan 18 × ( - 1 ) 3 = - 18 hingga momen ketiga sedangkan nilai positif berkontribusi 4 × 2 3 = 32 dan 13 × 1 3 = 13 , tepatnya menyeimbangkan kontribusi negatif. Kita dapat mengambil distribusi simetris sekitar 0 , seperti x =0(-3)3=-2718×(-1)3=-184×23=3213×13=130 dengan p = ( 1 , 4 , 1 ) / 6 , dan menggeser massa kecil dari + 1 ke + 2 , massa kecil dari + 1 ke - 1 , dan sedikit jumlah massa turun ke - 3 , menjaga mean pada 0 dan kemiringan pada 0x=(-1,0,1)hal=(1,4,1)/6+1+2+1-1-300juga, sambil menciptakan asimetri. Pendekatan yang sama akan bekerja untuk mempertahankan nol rata-rata dan nol kemiringan dari distribusi kontinu sambil menjadikannya asimetris; jika kita tidak terlalu agresif dengan perpindahan massa, itu akan tetap unimodal.


Edit: Distribusi Berkelanjutan

Karena masalah terus muncul, mari berikan contoh eksplisit dengan distribusi berkelanjutan. Peter Flom punya ide bagus: lihat campuran normals. Campuran dua normals tidak akan berfungsi: ketika kemiringannya menghilang, itu akan menjadi simetris. Kasus paling sederhana berikutnya adalah campuran tiga normals.

Campuran tiga normals, setelah pilihan lokasi dan skala yang tepat, bergantung pada enam parameter nyata dan karenanya harus memiliki fleksibilitas lebih dari cukup untuk menghasilkan solusi nol-skewness yang asimetris. Untuk menemukan beberapa, kita perlu tahu bagaimana menghitung kemiringan campuran normals. Di antara ini, kami akan mencari apa pun yang unimodal (mungkin tidak ada).

Sekarang, secara umum, momen ke- (non-sentral) dari distribusi normal standar adalah nol ketika r aneh dan sebaliknya sama dengan 2 r / 2 Γ ( 1 - rrthr . Ketika kami mengubah skala distribusi normal standar untuk memiliki standar deviasiσ,momenke-rdikalikan denganσr. Ketika kita menggeser distribusi apapun olehμ, barurthsaat dapat dinyatakan dalam momen hingga dan termasukr. Momen campuran distribusi (yaitu, rata-rata tertimbang dari mereka) adalah rata-rata tertimbang yang sama untuk setiap momen. Akhirnya, kemiringan adalah nol tepat ketika momen pusat ketiga adalah nol, dan ini mudah dihitung dalam hal tiga momen pertama.2r/2Γ(1-r2)/πσrthσrμrthr

Ini memberi kita serangan aljabar pada masalah. Salah satu solusi yang saya temukan adalah campuran yang sama dari tiga normals dengan parameter sama dengan ( 0 , 1 ) , ( 1 / 2 , 1 ) , dan ( 0 , (μ,σ)(0,1)(1/2,1). Artinya sama dengan(0+1/2+0)/3=1/6. Gambar ini menunjukkan pdf dengan warna biru dan pdf dari distribusimembalik tentang artinyadalam warna merah. Perbedaan mereka menunjukkan bahwa keduanya asimetris. (Mode adalah sekitar0,0519216, yang tidak sama dengan rata-rata1/6). Mereka berdua memiliki nol skewness oleh konstruksi.(0,127/18)(0,2.65623)(0+1/2+0)/3=1/60,05192161/6

Contoh berkelanjutan

Plot menunjukkan ini adalah unimodal. (Anda dapat memeriksa menggunakan Kalkulus untuk menemukan maksimum lokal.)


(+1) Jawabannya sangat apik. Akankah ini bekerja dengan distribusi kontinu? Bukankah pergeseran berpotensi menciptakan mode kecil kecil? Saya mungkin tidak berpikir jernih ...
Makro

1
Anda berpikir dengan cukup baik, Makro: kita semua harus sangat skeptis. Caranya adalah dengan menggeser jumlah kecil yang tersebar di rentang luas. Tes turunan pertama akan memungkinkan Anda untuk memeriksa kemungkinan mode dan juga memberikan dasar untuk bukti bahwa pergeseran yang cukup kecil dari formulir ini tidak akan menghasilkan mode baru.
whuber

Terima kasih atas jawabannya! Ini mirip dengan apa yang saya pikirkan secara intuisi, meskipun saya tidak dapat mengatakannya dengan baik - bahwa Anda harus "menyeimbangkan" massa di setiap sisi distribusi. Membuat saya bertanya-tanya apakah ada cara stereotip di mana seseorang dapat melakukan tindakan penyeimbangan ini.
Andy McKenzie

Salah satu cara, Andy, adalah memulai dengan solusi diskrit dan kemudian menggabungkannya dengan distribusi normal. Dalam hal ini, persyaratan unimodality akan memaksa distribusi normal untuk memiliki standar deviasi yang besar. Meski begitu, jika konvolusi tidak cukup mengubah properti yang diperlukan (seperti nol kemiringan), atau mengubahnya dengan cara yang dapat diprediksi, Anda memiliki pegangan matematika pada masalah tersebut. Dalam beberapa hal suntingan saya baru-baru ini dapat dipandang sebagai serangan seperti itu, meskipun itu bukan semata belitan (karena ketiga normalnya memiliki standar deviasi yang berbeda).
whuber

2
Saya telah memeriksa, Andy: menggabungkan solusi diskrit dengan distribusi normal tidak mengubah kemiringan. Ketika Anda memberikan distribusi normal deviasi standar sekitar 0,57 atau lebih besar, hasilnya adalah unimodal. Seperti distribusi diskrit yang mendasarinya, ia terus memiliki mean nol, kemiringan nol, dan asimetris. Mencampurnya dengan distribusi normal standar berarti pergerakan massa yang terkontrol antara standar normal dan distribusi diskrit: yang mungkin memenuhi permintaan Anda akan metode "stereotip".
Whuber

23

Ini adalah salah satu yang saya temukan di https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# yang saya anggap bagus dan direproduksi dalam R: invers Burr atau distribusi Dagum dengan parameter bentuk dan c = 18.1484 :k=0,0629c=18.1484

g(x)=ckx-(c+1)[1+x-c]-(k+1)

Ini memiliki rata-rata 0,5387, standar deviasi 0,2907, kemiringan 0,0000, dan kurtosis 2,0000. Sumber juga menyebutnya "distribusi gajah": masukkan deskripsi gambar di sini

Reproduksi saya di R dibuat dengan

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

Seperti yang ditunjukkan oleh hasil ini, kemiringan tidak cukup nol hingga empat digit untuk nilai parameter ini. Ini adalah pengoptimal kecil untuk dan c :kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

menghasilkan

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15

Terima kasih atas hasil editnya. Yang mengatakan, saya tidak bisa mereproduksi kemiringan 0,0000 menjadi empat digit, sebagai gantinya memperoleh 0,0001245138 sebagai gantinya (lihat edit berikutnya, dalam kode R).
Christoph Hanck

ck

Sebenarnya 0,0003756196. 0,0001245138 sudah setelah beberapa optimasi awal, diberikan di sini karena kesalahan. Akan saya lihat.
Christoph Hanck

@amoeba, saya mencoba sedikit mengoptimalkan, tetapi saya tidak mengklaim telah melakukannya dengan cara yang cerdas, saya memiliki sedikit pengalaman dengan optimasi.
Christoph Hanck

2
Skewness yang nol hingga tiga digit (hampir empat) cukup banyak di pikiranku; tidak seperti nilai yang lebih tepat akan membuatnya terlihat berbeda. Jika kemiringan akan melintasi nol di sekitar itu dan jelas arah apa yang mengubah nilai jika diperlukan lebih banyak akurasi, saya rasa itu sudah cukup. Tetapi pujian untuk upaya tambahan. (Ini contoh yang bagus.)
Glen_b -Reinstate Monica

9

Pertimbangkan distribusi pada bagian positif dari garis nyata yang meningkat secara linear dari 0 ke mode dan kemudian eksponensial ke kanan mode, tetapi kontinu pada mode.

Ini bisa disebut distribusi segitiga-eksponensial (meskipun sering terlihat agak seperti sirip hiu).

θλ

λθλθ6.15

Segitiga-Eksponensial dengan kemiringan nol

[1][2]

Utas Distribusi tidak normal dengan nol kemiringan dan nol kelebihan kurtosis? memiliki beberapa contoh asimetris, termasuk contoh diskrit kecil dan satu lagi unimodal kontinu:

Campuran Gaussian Unimodal dengan nol kemiringan

Distribusi unimodal diskrit - atau ekuivalen, sampel - dengan nol kemiringan cukup mudah dibangun, ukuran besar atau kecil.

Berikut ini contoh, yang dapat Anda perlakukan sebagai sampel atau (dengan membagi frekuensi mentah dengan 3000) sebagai PMF (nilai 'x' adalah nilai yang diambil, 'n' adalah berapa kali nilai muncul dalam sampel ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

Plot fungsi massa probabilitas yang dibangun dari atas

Contoh ini dibangun dari distribusi 3 titik:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

ccsayansayaxsaya=0sayansayaxsaya3=0c

Ada berbagai macam "atom" lain yang dapat dikonstruksikan, tetapi contoh ini hanya menggunakan jenis ini. Pada beberapa kombinasi atom seperti ini ditambahkan beberapa nilai yang ditempatkan secara simetris untuk mengisi lubang yang tersisa dan menjamin unimodality tanpa menghancurkan struktur mean dan momen ketiga.

[1]


[2]



3
Mungkin bisa menyebutnya sirip hiu?
Glen_b -Reinstate Monica

@ Glen_b Benar-benar sirip Hiu.
Alecos Papadopoulos

2

Yakin. Coba ini:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(Kamu sudah melakukan hal-hal yang sulit!)


1
bagus saya suka itu. +1
gung - Pasang kembali Monica

4
Ini bukan bimodal ... sangat multi- moda. Coba rencanakan kepadatannya; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
Tamu

1
Data yang dihasilkan dengan cara ini tentu bukan unimodal. Yang perlu Anda lakukan untuk melihat itu adalah memotong dan menempelkan kode Anda, kata demi kata. Memang, campuran variabel yang terdistribusi normal tidak akan pernah unimodal (kecuali tentu saja, salah satu proporsi campuran adalah 1).
Makro

8
@ Macro, itu tidak benar. Lihat, misalnya, abstrak Roeder 1994 (JASA) untuk hasil yang terkenal bahwa "kepadatan dua normals campuran bukan bimodal kecuali jika sarana dipisahkan oleh setidaknya 2 standar deviasi". Jika mereka dipisahkan oleh kurang dari ini, campurannya adalah unimodal.
Tamu

1
Anda benar @test. Saya lupa tentang kemungkinan itu ketika saya membuat posting saya
Makro

2

E[(X-μσ)3]=0
E[(X-μσ)3|Xμ]+E[(X-μσ)3|X>μ]=0.

YZμ

E[(Y-μσ)3]=E[(Z-μσ)3]
XYμ(μ-Z)

YZμμ


1
Bagaimana Anda menjamin bahwa distribusinya adalah unimodal?
Dilip Sarwate

YZμ

σYZ

@whuber: Sial. Aku tahu ada harus ada beberapa perangkap ... :-)
krlmlr

2

Distribusi diskrit berikut adalah asimetris dan memiliki kemiringan nol: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Saya menemukannya di koran Doric et al., Qual Quant (2009) 43: 481-493; DOI 10.1007 / s11135-007-9128-9


+1 Ini memeriksa dan ini unimodal. Itu contoh paling sederhana yang mungkin.
whuber
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.