Akan ada jumlah distribusi yang tak terbatas yang terlihat sangat mirip dengan gambar Anda, dengan berbagai nilai berbeda untuk kurtosis.
Dengan kondisi khusus dalam pertanyaan Anda dan mengingat kami memegang titik crossover untuk berada di dalam, atau setidaknya tidak terlalu jauh di luar±1 , seharusnya Anda mendapatkan kurtosis yang sedikit lebih besar daripada normal. Saya akan menunjukkan tiga kasus di mana itu terjadi, dan kemudian saya akan menunjukkan satu di mana itu lebih kecil - dan menjelaskan apa yang menyebabkannya terjadi.
Mengingat bahwa dan adalah pdf dan cdf normal standar masing-masing, mari kita tulis sendiri sedikit fungsiϕ(x)Φ(x)
f(x)={ϕ(x)a+b.g(x);|x|>t;|x|≤t
untuk beberapa kontinu, kerapatan simetris (dengan cdf ), dengan rata-rata , sehingga dan .gG0b=Φ(t)–½–t.ϕ(t)G(t)–½–t.g(t)a=ϕ(t)−b.g(t)
Yaitu, dan dipilih untuk membuat kerapatan berlanjut dan berintegrasi ke .ab1
Contoh 1 Pertimbangkandan,g(x)=3ϕ(3x)t=1
yang terlihat seperti gambar Anda, di sini dihasilkan oleh kode R berikut:
f <- function(x, t=1,
dg=function(x) 2*dnorm(2*x),
pg=function(x) pnorm(2*x),
b=(pnorm(t) - 0.5 - t*dnorm(t))/ (pg(t) - 0.5 - t*dg(t)),
a=dnorm(t)-b*dg(t) ) {
ifelse(abs(x)>t,dnorm(x),a+b*dg(x))
}
f1 <- function(x) f(x,t=1,dg=function(x) 3*dnorm(3*x),pg=function(x) pnorm(3*x))
curve(f1,-4,4,col=2)
lines(x,dnorm(x),col=3)
Sekarang perhitungannya. Mari kita membuat fungsi untuk mengevaluasi :xpf1(x)
fp <- function(x,p=2) x^p*f1(x)
sehingga kami dapat mengevaluasi momen. Pertama varians:
integrate(fp,-Inf,Inf) # should be just smaller than 1
0.9828341 with absolute error < 1.4e-07
Berikutnya momen sentral keempat:
integrate(fp,-Inf,Inf,p=4) # should be just smaller than 3
2.990153 with absolute error < 8.3e-06
Kami membutuhkan rasio angka-angka itu, yang harus memiliki akurasi sekitar 5 angka
integrate(fp,-Inf,Inf,p=4)$value/(integrate(fp,-Inf,Inf)$value^2)
[1] 3.095515
Jadi kurtosisnya sekitar 3.0955, sedikit lebih besar dari pada kasus normal.
Tentu saja kita bisa menghitungnya secara aljabar dan mendapatkan jawaban yang tepat, tetapi tidak perlu, ini memberi tahu kita apa yang ingin kita ketahui.
Contoh 2 Dengan fungsididefinisikan di atas kita dapat mencobanya untuk semua cara.fg
Inilah Laplace:
library(distr)
D <- DExp(rate = 1)
f2 <- function(x) f(x,t=1,dg=d(D),pg=p(D))
curve(f2,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp2 <- function(x,p=2) x^p*f2(x)
integrate(fp2,-Inf,Inf) # should be just smaller than 1
0.9911295 with absolute error < 1.1e-07
integrate(fp2,-Inf,Inf,p=4) # should be just smaller than 3
2.995212 with absolute error < 5.9e-06
integrate(fp2,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.049065
Tidak mengherankan, hasil yang sama.
Contoh 3 : Mari kitasebagai distribusi Cauchy (distribusi Student-t dengan 1 df), tetapi dengan skala 2/3 (yaitu, jikaadalah Cauchy standar,, dan sekali lagi mengatur ambang, t (memberikan poin,, di luar yang kita 'beralih' ke normal), menjadi 1.gh(x)g(x)=1.5h(1.5x)±t
dg <- function(x) 1.5*dt(1.5*x,df=1)
pg <- function(x) pt(1.5*x,df=1)
f3 <- function(x) f(x,t=1,dg=dg,pg=pg)
curve(f3,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp3 <- function(x,p=2) x^p*f3(x)
integrate(fp3,-Inf,Inf) # should be just smaller than 1
0.9915525 with absolute error < 1.1e-07
integrate(fp3,-Inf,Inf,p=4) # should be just smaller than 3
2.995066 with absolute error < 6.2e-06
integrate(fp3,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.048917
Dan hanya untuk menunjukkan bahwa kita benar-benar mendapatkan kepadatan yang tepat:
integrate(f3,-Inf,Inf)
1 with absolute error < 9.4e-05
Contoh 4 : Namun , apa yang terjadi ketika kita mengubah t ?
Ambil dan seperti contoh sebelumnya, tetapi ubah ambang ke :gGt=2
f4 <- function(x) f(x,t=2,dg=dg,pg=pg)
curve(f4,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp4 <- function(x,p=2) x^p*f4(x)
integrate(fp4,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 2.755231
Bagaimana ini bisa terjadi?
Nah, penting untuk mengetahui bahwa kurtosis adalah (berbicara sedikit longgar) 1+ varian kuadrat tentang :μ±σ
Ketiga distribusi memiliki mean dan varians yang sama.
Kurva hitam adalah kepadatan normal standar. Kurva hijau menunjukkan distribusi yang cukup terkonsentrasi tentang (yaitu, varians tentang kecil, yang mengarah ke kurtosis yang mendekati 1, yang terkecil mungkin). Kurva merah menunjukkan kasus di mana distribusi "didorong menjauh" dari ; itu adalah kurtosis yang besar.μ±σμ±σμ±σ
Dengan mengingat hal itu, jika kita menetapkan titik ambang cukup jauh di luar kita dapat mendorong kurtosis di bawah 3, dan masih memiliki puncak yang lebih tinggi.μ±σ