Intuisi (geometris atau lainnya) dari


18

Pertimbangkan identitas dasar varian:

Var(X)=E[(XE[X])2]=...=E[X2](E[X])2

Ini adalah manipulasi aljabar sederhana dari definisi momen sentral menjadi momen non-sentral.

Ini memungkinkan manipulasi yang mudah dari dalam konteks lain. Ini juga memungkinkan perhitungan varians melalui data single pass over daripada dua pass, pertama untuk menghitung rata-rata, dan kemudian untuk menghitung varians.Var(X)

Tapi apa artinya ? Bagi saya tidak ada intuisi geometris langsung yang berhubungan dengan penyebaran tentang mean untuk menyebar sekitar 0. Karena adalah himpunan pada dimensi tunggal, bagaimana Anda melihat penyebaran di sekitar rata-rata sebagai perbedaan antara penyebaran di sekitar asal dan kuadrat dari berarti?X

Adakah interpretasi aljabar linier yang baik atau interpretasi fisik atau lainnya yang akan memberikan wawasan tentang identitas ini?


7
Petunjuk: ini adalah Teorema Pythagoras.
whuber

1
@ Matius Saya bertanya-tanya apa yang dimaksudkan dengan " ". Saya menduga itu bukan harapan, tetapi hanya singkatan untuk aritmatika. Kalau tidak, persamaannya akan salah (dan hampir tidak berarti, karena mereka kemudian akan menyamakan variabel acak dengan angka). E
whuber

2
@whuber Karena produk dalam memperkenalkan ide jarak dan sudut, dan produk dalam dari ruang vektor variabel acak bernilai nyata didefinisikan sebagai (?), saya ingin tahu apakah beberapa intuisi geometri dapat diberikan melalui ketimpangan segitiga. Saya tidak tahu bagaimana melanjutkan, tetapi saya bertanya-tanya apakah itu masuk akal. E[XY]
Antoni Parellada

1
@Antoni Ketimpangan segitiga terlalu umum. Produk dalam adalah objek yang jauh lebih istimewa. Untungnya, intuisi geometris yang tepat adalah tepat dari geometri Euclidean. Selain itu, bahkan dalam kasus variabel acak dan , geometri yang diperlukan dapat dibatasi pada ruang vektor nyata dua dimensi yang dihasilkan oleh dan : yaitu, pada bidang Euclidean itu sendiri. Dalam contoh ini tidak tampak sebagai RV: itu hanya vektor. Di sini, ruang yang direntang oleh dan adalah bidang Euclidean tempat semua geometri terjadi. Y X Y X n X ( 1 , 1 , , 1 )XYXYXnX(1,1,,1)
whuber

3
Menyetel pada balasan yang saya , dan membagi semua istilah dengan (jika Anda mau) akan memberi Anda solusi aljabar lengkap untuk varians: tidak ada alasan untuk menyalinnya lagi. Itu karena adalah rata-rata aritmatika dari , di mana hanya kali varians seperti yang telah Anda tetapkan di sini, adalah kali rata-rata aritmatika kuadrat, dan adalah kali rata-rata aritmatika dari nilai kuadrat. n β 0y| | y - y | | 2n| | y | | 2n| | y| | 2nβ^1=0nβ^0y||yy^||2n||y^||2n||y||2n
whuber

Jawaban:


21

Memperluas pada titik @ whuber dalam komentar, jika dan adalah ortogonal, Anda memiliki Teorema Pythagoras :ZYZ

Y2+Z2=Y+Z2

Perhatikan bahwa adalah produk dalam yang valid dan bahwa adalah norma yang disebabkan oleh produk dalam itu .Y = Y,ZE[YZ]Y=E[Y2]

Biarkan menjadi beberapa variabel acak. Biarkan , Misalkan . Jika dan bersifat ortogonal:Y = E [ X ] Z = X - E [ X ] Y ZXY=E[X]Z=XE[X]YZ

Y2+Z2=Y+Z2E[E[X]2]+E[(XE[X])2]=E[X2]E[X]2+Var[X]=E[X2]

Dan sangat mudah untuk menunjukkan bahwa dan adalah orthogonal bawah produk dalam ini:Z = X - E [ X ]Y=E[X]Z=XE[X]

Y,Z=E[E[X](XE[X])]=E[X]2E[X]2=0

Salah satu kaki dari segitiga adalah , kaki yang lain adalah , dan sisi miring adalah . Dan teorema Pythagoras dapat diterapkan karena variabel acak yang direndahkan adalah ortogonal terhadap rata-ratanya.E [ X ] XXE[X]E[X]X


Komentar teknis:

Y = E [ X ] 1 E [ X ] 1 1 = [ 1 , 1 , 1 , , 1 ] Y X 1Y dalam contoh ini benar-benar harus menjadi vektor , yaitu skalar dikalikan vektor konstanta (misalnya dalam kasus hasil diskrit dan terbatas). adalah proyeksi vektor dari ke konstan vektor .Y=E[X]1E[X]11=[1,1,1,,1]YX1

Contoh sederhana

Pertimbangkan kasus di mana adalah variabel acak Bernoulli di mana . Kita punya:p = .2Xp=.2

X=[10]P=[.2.8]E[X]=iPiXi=.2

Y=E[X]1=[.2.2]Z=XE[X]=[.8.2]

Dan gambarnya adalah: masukkan deskripsi gambar di sini

Besarnya kuadrat dari vektor merah adalah varian , besarnya kuadrat dari vektor biru adalah , dan besarnya kuadrat dari vektor kuning adalah .E [ X ] 2 E [ X 2 ]XE[X]2E[X2]

INGATLAH bahwa besaran-besaran ini, ortogonalitas, dll ... tidak berkaitan dengan produk titik biasa tetapi produk dalam . Besarnya vektor kuning bukan 1, melainkan .2.I P i Y i Z iiYiZiiPiYiZi

Vektor merah dan vektor biru tegak lurus di bawah produk dalam tetapi mereka tidak tegak lurus di intro, rasa geometri sekolah menengah. Ingat kita tidak menggunakan produk titik biasa sebagai produk dalam!Z = X - E [ X ] i P i Y i Z i i Y i Z iY=E[X]Z=XE[X]iPiYiZiiYiZi


Itu sangat bagus!
Antoni Parellada

1
Jawaban yang bagus (+1), tetapi tidak memiliki angka, dan mungkin juga agak membingungkan untuk OP karena Z Anda adalah X ...
amoeba mengatakan Reinstate Monica

@ MatthewGunn, jawaban bagus. Anda dapat memeriksa jawaban saya di bawah ini untuk representasi di mana ortogonalitas dalam arti Euclidean.
YBE

Aku benci menjadi tumpul, tapi aku kesulitan menjaga , , dan arah logika lurus ('karena' datang di tempat-tempat yang tidak masuk akal bagiku). Rasanya seperti banyak fakta (yang dibuktikan dengan baik) dinyatakan secara acak. Apa ruang dalam produk dalam? Kenapa 1 ? V a r ( X )ZVar(X)
Mitch

@Mitch Urutan logisnya adalah: (1) Perhatikan bahwa ruang probabilitas mendefinisikan ruang vektor; kita dapat memperlakukan variabel acak sebagai vektor. (2) Tentukan produk dalam variabel acak dan sebagai . Dalam ruang produk dalam, vektor dan didefinisikan sebagai ortogonal jika produk dalam mereka nol. (3a) Misalkan adalah variabel acak. (3b) Misalkan dan . (4) Amati bahwa dan didefinisikan dengan cara ini adalah ortogonal. (5) Karena danZ E [ Y Z ] Y Z X Y = E [ X ] Z = X - E [ X ] Y Z Y ZYZE[YZ]YZXY=E[X]Z=XE[X]YZYZbersifat ortogonal, teorema pythagoras berlaku (6) Dengan aljabar sederhana, teorema Pythagoras setara dengan identitas.
Matthew Gunn

7

Saya akan menggunakan pendekatan geometris murni untuk skenario yang sangat spesifik. Mari kita pertimbangkan variabel acak bernilai mengambil nilai dengan probabilitas . Kami selanjutnya akan mengasumsikan bahwa variabel acak ini dapat direpresentasikan dalam sebagai vektor, . { x 1 , x 2 } ( p 1 , p 2 ) R 2 X = ( x 1 X{x1,x2}(p1,p2)R2X=(x1p1,x2p2)masukkan deskripsi gambar di sini

Perhatikan bahwa kuadrat panjang adalah yang sama dengan . Jadi, .x 2 1 p 1 + x 2 2 p 2 E [ X 2 ] X = Xx12p1+x22p2E[X2]X=E[X2]

Karena , ujung vektor sebenarnya melacak elips. Ini menjadi lebih mudah untuk melihat apakah seseorang mengulangi dan sebagai dan . Karenanya, kami memiliki dan .X p 1 p 2 cos 2 ( θ ) sin 2 ( θ ) p1+p2=1Xp1p2cos2(θ)sin2(θ)p1=cos(θ)p2=sin(θ)

Salah satu cara menggambar elips adalah melalui mekanisme yang disebut Trammel of Archimedes . Seperti dijelaskan dalam wiki: Ini terdiri dari dua angkutan yang terbatas ("trammelled") ke saluran atau rel tegak lurus, dan sebuah batang yang dilekatkan ke angkutan oleh pivot pada posisi tetap di sepanjang batang. Saat antar-jemput bergerak bolak-balik, masing-masing di sepanjang salurannya, ujung batang bergerak di jalur elips. Prinsip ini diilustrasikan dalam gambar di bawah ini.

Sekarang mari kita secara geometris menganalisis satu instance dari trammel ini ketika shuttle vertikal berada di dan shuttle horisontal berada di membentuk sudut . Karena konstruksi, dan , (di sini diasumsikan wlog).B θ | B X | = x 2 | A B | = x 1 - x 2θ x 1x 2ABθ|BX|=x2|AB|=x1x2θx1x2

masukkan deskripsi gambar di sini

Mari kita menggambar garis dari asal, , yang tegak lurus terhadap batang. Satu dapat menunjukkan bahwa . Untuk variabel acak spesifik ini Oleh karena itu, jarak tegak lurusdari asal ke batang sebenarnya sama dengan standar deviasi, .| O C | = ( x 1 - x 2 ) sin ( θ ) cos ( θ ) V a r ( X )OC|OC|=(x1x2)sin(θ)cos(θ)| OC| σ

Var(X)=(x12p1+x22p2)(x1p1+x2p2)2=x12p1+x22p2x12p12x22p222x1x2p1p2=x12(p1p12)+x22(p2p22)2x1x2p1p2=p1p2(x122x1x2+x22)=[(x1x2)p1p2]2=|OC|2
|OC|σ

Jika kita menghitung panjang segmen dari ke : X | C X |CX

|CX|=x2+(x1x2)cos2(θ)=x1cos2(θ)+x2sin2(θ)=x1p1+x2p2=E[X]

Menerapkan Teorema Pythagoras dalam segitiga OCX, kita berakhir dengan

E[X2]=Var(X)+E[X]2.

Untuk meringkas , untuk trammel yang menggambarkan semua variabel acak yang mungkin dinilai bernilai mengambil nilai , adalah jarak dari titik asal ke ujung mekanisme dan standar deviasi adalah jarak tegak lurus ke batang.{x1,x2} σE[X2]σ

Catatan : Perhatikan bahwa ketika adalah atau , sepenuhnya deterministik. Ketika adalah kita berakhir dengan varians maksimum.0 π / 2 X θ π / 4θ0π/2Xθπ/4


1
+1 Jawaban yang bagus. Dan mengalikan vektor dengan kuadrat probabilitas adalah trik keren / berguna untuk membuat gagasan probabilistik biasa tentang ortogonalitas terlihat ortogonal!
Matthew Gunn

Grafis luar biasa. Simbol-simbol semuanya masuk akal (trammel yang menggambarkan elips dan kemudian Pythagoras Thm berlaku) tetapi entah bagaimana saya tidak mendapatkan secara intuitif bagaimana ini memberikan gagasan tentang bagaimana 'secara ajaib' itu menghubungkan momen (penyebaran dan pusat.
Mitch

pertimbangkan trammel sebagai proses yang mendefinisikan semua variabel acak bernilai . Ketika batang horizontal atau vertikal, Anda memiliki RV deterministik. Di tengah ada keacakan dan ternyata dalam kerangka geometris yang saya usulkan bagaimana acak RV (std) diukur dengan tepat dengan jarak batang ke asal. Mungkin ada hubungan yang lebih dalam di sini karena kurva eliptik menghubungkan berbagai objek dalam matematika tetapi saya bukan ahli matematika sehingga saya tidak bisa benar-benar melihat hubungan itu. (x1,x2)
YBE

3

Anda dapat mengatur ulang sebagai berikut:

Var(X)=E[X2](E[X])2E[X2]=(E[X])2+Var(X)

Kemudian, tafsirkan sebagai berikut: kuadrat yang diharapkan dari variabel acak sama dengan kuadrat dari rata-rata ditambah deviasi kuadrat yang diharapkan dari rata-rata.


Oh Hah. Sederhana. Tapi kotak-kotak itu masih tampak agak tidak diinterpretasikan. Maksud saya masuk akal (semacam, sangat longgar) tanpa kotak.
Mitch

3
Saya tidak menjual ini.
Michael R. Chernick

1
Jika teorema Pythagoras berlaku, apakah segitiga dengan sisi apa dan bagaimana kedua kaki tegak lurus?
Mitch

1

Maaf karena tidak memiliki keterampilan untuk menguraikan dan memberikan jawaban yang tepat, tetapi saya pikir jawabannya terletak pada konsep mekanika klasik fisik momen, terutama konversi antara 0 momen "mentah" berpusat dan momen tengah terpusat berarti. Ingatlah bahwa varians adalah momen sentral urutan kedua dari variabel acak.


1

Intuisi umum adalah bahwa Anda dapat menghubungkan momen-momen ini menggunakan Teorema Pythagoras (PT) dalam ruang vektor yang sesuai, dengan menunjukkan bahwa dua momen itu tegak lurus dan yang ketiga adalah sisi miringnya. Satu-satunya aljabar yang dibutuhkan adalah untuk menunjukkan bahwa kedua kaki memang orthogonal.

Demi yang berikut, saya akan menganggap Anda berarti sampel rata-rata dan varians untuk keperluan perhitungan daripada momen untuk distribusi penuh. Itu adalah:

E[X]=1nxi,mean,first central sample momentE[X2]=1nxi2,second sample moment (noncentral)Var(X)=1n(xiE[X])2,variance,second central sample moment

(di mana semua jumlah lebih dari item).n

Sebagai referensi, bukti dasar dari hanyalah simbol yang mendorong: V a r ( X )Var(X)=E[X2]E[X]2

Var(X)=1n(xiE[X])2=1n(xi22E[X]xi+E[X]2)=1nxi22nE[X]xi+1nE[X]2=E[X2]2E[X]2+1nnE[X]2=E[X2]E[X]2

Ada sedikit makna di sini, hanya manipulasi aljabar dasar. Orang mungkin memperhatikan bahwa adalah konstanta di dalam penjumlahan, tetapi itu saja.E[X]

Sekarang dalam ruang vektor / interpretasi geometri / intuisi, apa yang akan kami tunjukkan adalah persamaan yang disusun ulang yang sesuai dengan PT, yang

Var(X)+E[X]2=E[X2]

Jadi pertimbangkan , sampel n item, sebagai vektor dalam R n . Dan mari kita buat dua vektor E [ X ] 1 dan X - E [ X ] 1 .XnRnE[X]1XE[X]1

Vektor memiliki rata-rata sampel karena setiap koordinatnya.E[X]1

Vektor adalah x 1 - E [ X ] , ... , x n - E [ X ] .XE[X]1x1E[X],,xnE[X]

Kedua vektor ini adalah tegak lurus karena produk titik dari kedua vektor tersebut berubah menjadi 0:

E[X]1(XE[X]1)=E[X](xiE[X])=(E[X]xiE[X]2)=E[X]xiE[X]2=nE[X]E[X]nE[X]2=0

Jadi kedua vektor itu tegak lurus yang artinya mereka adalah dua kaki segitiga siku-siku.

Kemudian oleh PT (yang berlaku di ), jumlah kuadrat dari panjang kedua kaki sama dengan kuadrat dari sisi miring.Rn

Dengan aljabar yang sama yang digunakan dalam bukti aljabar membosankan di atas, kami menunjukkan bahwa kami mendapatkan bahwa adalah kuadrat dari vektor miring:E[X2]

mana kuadratkan adalah produk titik (dan itu benar-benar E [ x ] 1 dan ( X - E [ X ] ) 2 adalah V a r ( X ) .(XE[X])2+E[X]2=...=E[X2]E[x]1(XE[X])2Var(X)

nnnn

E[X2]

n


Saya juga tertarik pada interpretasi / intuisi di balik persamaan tradeoff varians bias yang serupa. Adakah yang punya petunjuk di sana?
Mitch

piipi=1nipiXiYi=1niXiYiE[XY]XYnipi=1nE[XY]=ipiXiYinE[XY]Pipi=1n

x^y^x^i=xipiy^i=xipix^y^=ixipiyipi=ipixiyi=E[xy]x^y^E[xy]
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.