Intuisi sejenak tentang rata-rata distribusi?


13

Dapatkah seseorang memberikan intuisi tentang mengapa momen yang lebih tinggi dari distribusi probabilitas pX , seperti momen ketiga dan keempat, masing-masing berhubungan dengan kemiringan dan kurtosis? Secara khusus, mengapa penyimpangan tentang rata-rata dinaikkan ke kekuatan ketiga atau keempat akhirnya diterjemahkan menjadi ukuran skewness dan kurtosis? Apakah ada cara untuk menghubungkan ini dengan turunan ketiga atau keempat dari fungsi?

Pertimbangkan definisi skewness dan kurtosis ini:

Skewness(X)=E[(XμX)3]/σ3,Kurtosis(X)=E[(XμX)4]/σ4.

Dalam persamaan ini kita menaikkan nilai dinormalisasi (Xμ)/σ ke daya dan mengambil nilai yang diharapkan. Tidak jelas bagi saya mengapa menaikkan variabel acak dinormalisasi ke kekuatan empat memberikan "puncaknya" atau mengapa menaikkan variabel acak dinormalisasi ke kekuatan tiga harus memberikan "kecondongan". Ini sepertinya ajaib dan misterius!


4
Intuisi saya tentang condong adalah untuk mencatat bahwa kekuatan ketiga mempertahankan yang negatif. Jadi, jika Anda memiliki penyimpangan negatif yang lebih besar dari mean daripada yang Anda lakukan positif (sederhananya), maka Anda berakhir dengan distribusi miring negatif. Intuisi saya untuk kurtosis adalah bahwa kekuatan keempat memperkuat penyimpangan besar dari rata-rata lebih dari kekuatan kedua. Inilah mengapa kita menganggap kurtosis sebagai ukuran seberapa gemuk ekor suatu distribusi. Perhatikan bahwa kemungkinan x yang sangat besar dari rata-rata mu dinaikkan ke daya keempat, yang membuatnya diperbesar tetapi mengabaikan tanda.
wolfsatthedoor


1
Karena kekuatan ke-4 jauh lebih dipengaruhi oleh pencilan daripada kekuatan ke-1, saya berharap Anda akan mendapat sedikit dari melihat momen keempat tentang median - setidaknya jika ketahanan adalah tujuannya.
Glen_b -Reinstate Monica

1
Pertama, perhatikan bahwa momen-momen yang lebih tinggi ini belum tentu baik / dapat diandalkan sebagai ukuran asimetri / puncak. Yang mengatakan, saya pikir balok memberikan intuisi fisik yang baik untuk tiga momen pertama, misalnya mean = keseimbangan balok / skala , varians = cantilever flexure , skewness = jungkat-jungkit .
GeoMatt22

1
Anda benar, penafsiran kurtosis sebagai mengukur "puncak" adalah magis dan misterius. Itu karena itu sama sekali tidak benar. Kurtosis sama sekali tidak memberi tahu Anda tentang puncaknya. Mengukur ekor (outlier) saja. Mudah untuk membuktikan secara matematis bahwa pengamatan di dekat puncak berkontribusi jumlah sangat kecil untuk ukuran kurtosis, terlepas dari apakah puncaknya datar, berduri, bimodal, sinusoidal, atau berbentuk lonceng.
Peter Westfall

Jawaban:


7

Ada alasan bagus untuk definisi ini, yang menjadi lebih jelas ketika Anda melihat bentuk umum untuk momen variabel acak standar. Untuk menjawab pertanyaan ini, pertama mempertimbangkan bentuk umum dari n th standar saat tengah :

ϕn=E[(XE[X]S[X])n ].

Dua momen sentral standar pertama adalah nilai ϕ1=0 dan ϕ2=1 , yang berlaku untuk semua distribusi yang kuantitasnya di atas didefinisikan dengan baik. Oleh karena itu, kita dapat mempertimbangkan momen sentral standar non-sepele yang terjadi untuk nilai n3 . Untuk memudahkan analisis kami, kami mendefinisikan:

ϕn+=E[|XE[X]S[X]|n |X>E[X]]P(X>E[X]),ϕn=E[|XE[X]S[X]|n |X<E[X]]P(X<E[X]).

Ini adalah jumlah non-negatif yang memberikan kekuatan mutlak ke- n dari variabel acak terstandar yang kondisinya di atas atau di bawah nilai yang diharapkan. Kami sekarang akan menguraikan momen sentral terstandarisasi menjadi bagian-bagian ini.


Nilai ganjil dari n mengukur kemiringan pada buntut : Untuk nilai ganjil n3 kita memiliki kekuatan ganjil dalam persamaan momen dan sehingga kita dapat menulis momen pusat terstandarisasi sebagai ϕn=ϕn+ϕn . Dari bentuk ini kita melihat bahwa momen sentral terstandarisasi memberi kita perbedaan antara kekuatan absolut ke- n dari variabel acak terstandarisasi, yang bergantung padanya masing-masing berada di atas atau di bawah rata-rata.

Dengan demikian, untuk kekuatan ganjil n3 kita akan mendapatkan ukuran yang memberikan nilai positif jika kekuatan absolut yang diharapkan dari variabel acak standar lebih tinggi untuk nilai di atas rata-rata daripada untuk nilai di bawah rata-rata, dan memberikan nilai negatif jika mutlak diharapkan daya lebih rendah untuk nilai di atas rata-rata daripada nilai di bawah rata-rata. Setiap jumlah ini secara wajar dapat dianggap sebagai ukuran dari jenis "kecondongan", dengan kekuatan yang lebih tinggi memberikan bobot relatif lebih besar untuk nilai-nilai yang jauh dari rata-rata.

Karena fenomena ini terjadi untuk setiap kekuatan ganjil n3 , pilihan alami untuk ukuran arketip "skewness" adalah mendefinisikan ϕ3 sebagai skewness. Ini adalah momen pusat terstandardisasi lebih rendah daripada kekuatan ganjil yang lebih tinggi, dan itu wajar untuk mengeksplorasi momen orde rendah sebelum mempertimbangkan momen orde tinggi. Dalam statistik, kami telah mengadopsi konvensi yang merujuk pada momen sentral terstandarisasi ini sebagai kemiringan , karena momen sentral terstandarisasi terendah yang mengukur aspek distribusi ini. (Kekuatan aneh yang lebih tinggi juga mengukur jenis kemiringan, tetapi dengan penekanan yang lebih besar dan lebih besar pada nilai-nilai yang jauh dari nilai tengah.)


Nilain genap n mengukur lemak ekor: Untuk nilai genap n3 kita memiliki kekuatan genap dalam persamaan momen dan sehingga kita dapat menulis momen pusat terstandarisasi sebagai ϕn=ϕn++ϕn . Dari formulir ini kita melihat bahwa momen sentral terstandarisasi memberi kita jumlah dari kekuatan absolut ke- n dari variabel acak terstandarisasi, yang bergantung padanya masing-masing berada di atas atau di bawah rata-rata.

Dengan demikian, untuk daya genap n3 kita akan mendapatkan ukuran yang memberikan nilai non-negatif, dengan nilai yang lebih tinggi terjadi jika ekor distribusi variabel acak standar lebih gemuk. Perhatikan bahwa ini adalah hasil sehubungan dengan variabel acak standar , dan perubahan skala (mengubah varians) tidak berpengaruh pada ukuran ini. Alih-alih, ini secara efektif mengukur tingkat kegelapan ekor, setelah menstandardisasi varian distribusi. Setiap jumlah ini secara wajar dapat dianggap sebagai ukuran dari jenis "kurtosis", dengan kekuatan yang lebih tinggi memberikan bobot relatif lebih besar untuk nilai-nilai yang jauh dari rata-rata.

n3ϕ4



2

Pertanyaan serupa Apa 'momen' tentang 'momen' dari distribusi probabilitas? Saya memberikan jawaban fisik untuk apa yang membahas momen.

dωdt=α,dθdt=ωθ

Lihat tautannya karena ini mungkin lebih mudah untuk memvisualisasikannya dengan contoh fisik.

Skewness lebih mudah dipahami daripada kurtosis. Kecondongan negatif adalah ekor kiri yang lebih berat (atau lebih jauh arah negatifnya) daripada di sebelah kanan dan kemiringan positif sebaliknya.

x


Z3Z4Z3Z4

@ PeterWestfall Saya setuju bahwa interpretasi Moor tidak sempurna. Bahasa yang tepat tidak mudah dicapai tanpa juga membingungkan. Ambil "leverage" misalnya. Leverage berarti momen pertama dan seseorang harus menciptakan sesuatu seperti "leverage leverage" untuk momen kedua, yang mungkin membingungkan lebih dari sekadar menerangi. Pendekatan Anda tampaknya menciptakan konsep baru, yaitu, "leverage yang diperluas," yang mengisyaratkan transformasi geometris yang juga dapat diklaim beberapa advokat yang mendukungnya sebagai konsisten dengan risiko juga kontroversial, dan non-fisik untuk orang lain. .
Carl

UU=Z4

Z4Z

Z2
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.