Apa sebenarnya momen itu? Bagaimana mereka diturunkan?


19

Kami biasanya diperkenalkan dengan metode penduga momen dengan "menyamakan momen populasi dengan sampel pendampingnya" hingga kami memperkirakan semua parameter populasi; sehingga, dalam kasus distribusi normal, kita hanya perlu momen pertama dan kedua karena mereka sepenuhnya menggambarkan distribusi ini.

E(X)=μi=1nXi/n=X¯

E(X2)=μ2+σ2i=1nXi2/n

Dan kami secara teoritis dapat menghitung hingga momen tambahan sebagai:n

E(Xr)i=1nXir/n

Bagaimana saya bisa membangun intuisi untuk momen apa sebenarnya? Saya tahu mereka ada sebagai konsep dalam fisika dan matematika, tetapi saya menemukan keduanya tidak dapat diterapkan secara langsung, terutama karena saya tidak tahu bagaimana membuat abstraksi dari konsep massa ke titik data. Istilah ini tampaknya digunakan secara khusus dalam statistik, yang berbeda dari penggunaan dalam disiplin ilmu lain.

Apa karakteristik data saya yang menentukan berapa banyak ( ) momen yang ada secara keseluruhan?r


7
Istilah ini berarti hal yang sama dengan yang dilakukannya dalam fisika, ketika diterapkan pada distribusi probabilitas. Lihat di sini , yang memiliki persamaan , "di mana adalah distribusi kepadatan muatan, massa, atau kuantitas apa pun yang sedang dipertimbangkan ". Ketika "hal yang dipertimbangkan" adalah kepadatan probabilitas, Anda memiliki momen yang sesuai dalam probabilitas. Itu adalah momen mentah (momen tentang asal). Sebagai perbandingan ... ( ρμn=rnρ(r)drρ
ctd

2
Momen adalah fitur parametrized dari distribusi variabel acak, seperti kuantil. Momen diparameterisasi oleh bilangan asli, dan sepenuhnya mencirikan distribusi (lihat fungsi pembangkit momen ). Ini tidak mengesampingkan bahwa untuk beberapa distribusi mungkin ada ketergantungan fungsional sempurna antara momen, jadi tidak semua momen selalu diperlukan untuk mengkarakterisasi distribusi. (1/2)
tchakravarty

Momen secara fungsional bergantung pada dua yang pertama untuk distribusi normal, sehingga dua yang pertama mencirikan distribusi, termasuk mean dan varians. (2/2)3
tchakravarty

5
(ctd) ... momen dalam matematika adalah sama ( ), kecuali sekitar daripada 0 (Yaitu hanya bentuk umum dari fisika yang - tetapi karena mereka sama dengan perubahan asal semata, seorang fisikawan akan dengan benar mengatakan "bagaimana itu berbeda?"). Ini sama dengan probabilitas, ketika adalah kepadatan. Bagi saya, ketiganya berbicara tentang hal yang sama ketika mereka mengatakan 'momen', bukan hal yang berbeda. c fμn=(xc)nf(x)dxcf
Glen_b -Reinstate Monica

3
Saya yakin Anda dapat menemukan jawaban di banyak utas yang telah diposting tentang momen dan intuisi . Statistik menggunakan momen dengan cara yang persis sama dengan yang digunakan dalam fisika dan matematika - itu adalah konsep yang sama dengan definisi yang sama di ketiga bidang.
whuber

Jawaban:


17

Sudah lama sejak saya mengambil kelas fisika, jadi beri tahu saya jika semua ini salah.

Gambaran umum momen dengan analog fisik

Mengambil variabel acak, . The saat -th sekitar adalah: berkorespondensi ini persis dengan arti fisik sesaat. Bayangkan sebagai kumpulan poin di sepanjang garis nyata dengan kepadatan yang diberikan oleh pdf. Tempatkan titik tumpu di bawah garis ini di dan mulai menghitung momen relatif terhadap titik tumpu itu, dan perhitungan akan sesuai persis dengan momen statistik.n X c m n ( c ) = E [ ( X - c ) n ] X cXnXc

mn(c)=E[(Xc)n]
Xc

Sebagian besar waktu, saat -th mengacu pada saat sekitar 0 (saat-saat di mana titik tumpu ditempatkan pada 0): The -th sentral saat adalah: Ini sesuai dengan momen di mana titik tumpu ditempatkan di pusat massa, sehingga distribusinya seimbang. Ini memungkinkan momen untuk lebih mudah ditafsirkan, seperti yang akan kita lihat di bawah ini. Momen sentral pertama akan selalu nol, karena distribusinya seimbang.X m n = E [ X n ] n X m n = m n ( m 1 ) = E [ ( X - m 1 ) n ]nX

mn=E[Xn]
nX
m^n=mn(m1)=E[(X-m1)n]

The -th standar saat adalah: Sekali lagi, ini menskala momen dengan penyebaran distribusi, memungkinkan interpretasi yang lebih mudah khususnya Kurtosis. Momen standar pertama akan selalu nol, momen kedua akan selalu menjadi nol. Ini sesuai dengan momen skor standar (skor-z) suatu variabel. Saya tidak memiliki analog fisik yang bagus untuk konsep ini.X ~ m n = m nnX

m~n=m^n(m^2)n=E[(X-m1)n](E[(X-m1)2])n

Momen yang umum digunakan

Untuk distribusi apa pun, ada potensi momen tak terbatas. Saat-saat yang cukup hampir selalu akan sepenuhnya menjadi ciri dan distribusi (menurunkan kondisi yang diperlukan untuk memastikan hal ini adalah bagian dari masalah saat ). Empat momen biasanya banyak dibicarakan dalam statistik:

  1. Berarti - saat 1 (berpusat di sekitar nol). Ini adalah pusat massa distribusi, atau sebagai alternatifnya sebanding dengan momen torsi distribusi relatif terhadap titik tumpu pada 0.
  2. Variance - momen sentral ke-2. Diterjemahkan sebagai mewakili sejauh mana distribusi tersebar. Ini sesuai dengan momen inersia distribusi yang seimbang pada titik tumpu nya.X
  3. Skewness - momen sentral ke-3 (terkadang standar). Ukuran kemiringan distribusi dalam satu arah atau yang lain. Relatif terhadap distribusi normal (yang tidak memiliki kemiringan), distribusi dengan kemiringan positif memiliki probabilitas rendah untuk hasil yang sangat tinggi, distribusi dengan kemiringan negatif memiliki kemungkinan kecil untuk hasil yang sangat rendah. Analog fisik sulit, tetapi secara longgar mengukur asimetri suatu distribusi. Sebagai contoh, gambar di bawah ini diambil dari Wikipedia . Skewness, diambil dari Wikipedia
  4. Kurtosis - momen standar ke-4, biasanya kelebihan Kurtosis, momen standar ke-4 minus tiga. Kurtosis mengukur sejauh mana menempatkan lebih banyak kemungkinan pada pusat distribusi relatif terhadap ekor. Kurtosis yang lebih tinggi berarti lebih sedikit penyimpangan yang lebih besar dari rata-rata dan lebih sering penyimpangan yang lebih kecil. Ini sering ditafsirkan relatif terhadap distribusi normal, yang memiliki momen standar ke-4 3, sehingga kelebihan Kurtosis 0. Di sini analog fisik lebih sulit, tetapi pada gambar di bawah ini, diambil dari Wikipedia , distribusi dengan puncak yang lebih tinggi memiliki Kurtosis yang lebih besar. XKurtosis, juga dari WIkipedia

Kami jarang berbicara tentang saat-saat di luar Kurtosis, justru karena hanya ada sedikit intuisi bagi mereka. Ini mirip dengan fisikawan yang berhenti setelah momen kedua.


6

Ini sedikit dari utas lama, tetapi saya ingin memperbaiki salah saji dalam komentar oleh Fg Nu yang menulis "Momen diparameterisasi dengan bilangan asli, dan sepenuhnya mencirikan distribusi".

Momen TIDAK sepenuhnya mencirikan distribusi. Secara khusus, pengetahuan tentang semua momen yang tak terbatas, bahkan jika ada, tidak secara unik menentukan distribusi.

Per buku probabilitas favorit saya, Feller "Pengantar Teori Probabilitas dan Penerapannya Vol II" (lihat jawaban saya di contoh kehidupan nyata dari distribusi umum ), bagian VII.3 contoh di hlm. 227-228, Lognormal tidak ditentukan berdasarkan momennya, artinya ada distribusi lain yang memiliki semua momen tak terbatas sama dengan Lognormal, tetapi fungsi distribusi berbeda. Seperti diketahui secara luas, Moment Generating Function tidak ada untuk Lognormal, juga tidak bisa untuk distribusi lain ini yang memiliki momen yang sama.

Sebagaimana dinyatakan pada hal. 228, variabel pada dasarnya bukan nol ditentukan oleh momen-momennya jika semuanya ada danX

n=1(E[X2n])-1/(2n)

menyimpang. Perhatikan bahwa ini bukan jika dan hanya jika. Kondisi ini tidak berlaku untuk Lognormal, dan memang itu tidak ditentukan oleh momennya.

Di sisi lain, distribusi (variabel acak) yang berbagi semua jumlah momen tak terbatas, hanya dapat sangat berbeda, karena ketidaksetaraan yang dapat diturunkan dari momennya.


Ini sangat disederhanakan ketika distribusi dibatasi, dalam hal ini momen selalu menentukan distribusi sepenuhnya (unik).
Alex R.

@Alex Itu konsekuensi langsung dari hasil yang dikutip dalam Feller.
Whuber

Tidak sepenuhnya benar untuk mengatakan bahwa fungsi menghasilkan momen tidak ada untuk lognormal. Teorema yang paling berguna tentang mgf mengasumsikan itu ada dalam interval terbuka yang mengandung nol, dan dalam arti sempit itu tidak ada. Tapi itu memang ada dalam sinar yang berasal dari nol !, dan itu juga memberikan informasi yang bermanfaat.
kjetil b halvorsen

@ kjetil b halvorsen, dapatkah Anda menjelaskan (sebagian) informasi berguna yang akan Anda dapatkan dari keberadaan MGF lognormal pada berkas yang berasal dari nol? Sinar apa itu?
Mark L. Stone

Benjolan komentar di atas sebagai pertanyaan ke @ kjetil b halvorsen ..
Mark L. Stone

2

Sebuah konsekuensi wajar dari pernyataan Glen_b adalah bahwa momen pertama, rata-rata, sesuai dengan pusat gravitasi untuk objek fisik, dan momen kedua di sekitar rata-rata, varians, sesuai dengan momen inersia. Setelah itu, Anda sendirian.


3
Saya suka hubungan momen pertama dan rata-rata ... tetapi momen kedua bukan varians ... varians adalah momen kedua terpusat ... . v a r [ x ] = E [ ( x - E [ x ] ) 2 ] = ( x - E [ x ] ) 2 f ( x ) d xE[x2]=x2f(x)dx vSebuahr[x]=E[(x-E[x])2]=(x-E[x])2f(x)dx
Zachary Blumenfeld

0

Pohon binomial memiliki dua cabang masing-masing dengan kemungkinan 0,5. Sebenarnya, p = 0,5, dan q = 1-0,5 = 0,5. Ini menghasilkan distribusi normal dengan massa probabilitas terdistribusi secara merata.

Sebenarnya, kita harus mengasumsikan bahwa setiap tingkatan dalam pohon sudah lengkap. Ketika kami memecah data menjadi sampah, kami mendapatkan nomor nyata dari divisi, tetapi kami mengumpulkan. Ya, itu tingkat yang tidak lengkap, jadi kami tidak berakhir dengan histogram yang mendekati normal.

Ubah probabilitas percabangan ke p = 0,9999 dan q = 0,0001 dan itu membuat kita menjadi condong normal. Massa probabilitas bergeser. Itu menyumbang kemiringan.

Memiliki tingkatan atau tempat sampah yang kurang dari 2 ^ n menghasilkan pohon binomial dengan area yang tidak memiliki massa kemungkinan. Ini memberi kita kurtosis.


Tanggapan terhadap komentar:

Ketika saya berbicara tentang menentukan jumlah bin, bulatkan ke bilangan bulat berikutnya.

Mesin Quincunx menjatuhkan bola yang akhirnya mendekati distribusi normal melalui binomial. Beberapa asumsi dibuat oleh mesin seperti itu: 1) jumlah nampan terbatas, 2) pohon yang mendasarinya biner, dan 3) probabilitasnya tetap. Mesin Quincunx di Museum Matematika di New York, memungkinkan pengguna mengubah probabilitas secara dinamis. Peluangnya dapat berubah kapan saja, bahkan sebelum lapisan saat ini selesai. Karenanya ide tentang tempat sampah ini tidak terisi.

Tidak seperti apa yang saya katakan dalam jawaban asli saya ketika Anda memiliki kekosongan di pohon, distribusi menunjukkan kurtosis.

Saya melihat ini dari perspektif sistem generatif. Saya menggunakan segitiga untuk merangkum pohon keputusan. Ketika keputusan baru dibuat, lebih banyak nampan ditambahkan di dasar segitiga, dan dalam hal distribusi, di ekor. Memotong sub pohon dari pohon akan membuat kekosongan dalam massa probabilitas distribusi.

Saya hanya menjawab untuk memberi Anda rasa intuitif. Label? Saya telah menggunakan Excel dan bermain dengan probabilitas di binomial dan menghasilkan kemiringan yang diharapkan. Saya belum melakukannya dengan kurtosis, itu tidak membantu bahwa kita dipaksa untuk berpikir tentang massa probabilitas sebagai statis saat menggunakan bahasa yang menyarankan gerakan. Data atau bola yang mendasarinya menyebabkan kurtosis. Kemudian, kami menganalisanya dengan beragam dan mengaitkannya dengan istilah deskriptif seperti pusat, bahu, dan ekor. Satu-satunya hal yang harus kita kerjakan adalah tempat sampah. Sampah menjalani kehidupan yang dinamis bahkan jika data tidak bisa.


2
Ini menarik, tapi sangat samar. Apa label pada pohon binomial Anda, misalnya? Sebaiknya menjadi pohon tanpa batas jika Anda ingin mendapatkan distribusi normal - tetapi kemudian label yang jelas (menggunakan jalan acak atau menggunakan representasi biner dari bilangan real) sama sekali tidak mengarah ke distribusi normal. Tanpa perincian ini, terlalu banyak yang tersisa untuk imajinasi pembaca. Bisakah Anda menguraikannya?
whuber
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.