Masalah dengan garis penalaran Anda adalah
"Saya pikir kita selalu dapat menganggap independen dari X lainnya ."XX
ini tidak terlepas dari X . Simbol X digunakan untuk merujuk ke variabel acak yang sama di sini. Setelah Anda mengetahui nilai X pertama yangmuncul dalam rumus Anda, ini juga memperbaiki nilai X kedua yangmuncul. Jika Anda ingin mereka merujuk ke variabel acak yang berbeda (dan berpotensi independen), Anda harus menunjukkannya dengan huruf yang berbeda (misalnya X dan Y ) atau menggunakan subskrip (misalnya X 1 dan X 2 ); yang terakhir sering (tetapi tidak selalu) digunakan untuk menunjukkan variabel yang diambil dari distribusi yang sama.XXXXXXYX1X2
Jika dua variabel dan Y adalah independen maka Pr ( X = a | Y = b ) adalah sama dengan Pr ( X = a ) : mengetahui nilai Y tidak memberikan informasi tambahan tentang nilai X . Tetapi Pr ( X = a | X = b ) adalah 1 jika a = b dan 0 sebaliknya: mengetahui nilai XXYPr(X=a|Y=b)Pr(X=a)YXPr(X=a|X=b)1a=b0Xmemberikan informasi yang lengkap tentang nilai . [Anda dapat mengganti probabilitas dalam paragraf ini dengan fungsi distribusi kumulatif, atau jika sesuai, fungsi kepadatan probabilitas, untuk efek dasarnya sama.]X
Cara lain untuk melihat hal-hal adalah bahwa jika dua variabel independen maka mereka memiliki korelasi nol (meskipun nol korelasi tidak berarti kemerdekaan !) Tapi yang sempurna berkorelasi dengan dirinya sendiri, Corr ( X , X ) = 1 sehingga X tidak bisa mandiri itu sendiri. Perhatikan bahwa karena kovarians diberikan oleh Cov ( X , Y ) = Corr ( X , Y ) √XCorr(X,X)=1X , laluCov(X,X)=1 √Cov(X,Y)=Corr(X,Y)Var(X)Var(Y)−−−−−−−−−−−−√
Cov(X,X)=1Var(X)2−−−−−−−√=Var(X)
Rumus yang lebih umum untuk varians dari penjumlahan dari dua variabel acak adalah
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
Secara khusus, , jadiCov(X,X)=Var(X)
Var(X+X)=Var(X)+Var(X)+2Var(X)=4Var(X)
yang sama seperti yang Anda simpulkan dari penerapan aturan
Var(aX)=a2Var(X)⟹Var(2X)=4Var(X)
WXYZabcd
Cov(aW+bX,Y)=aCov(W,Y)+bCov(X,Y)
Cov(X,cY+dZ)=cCov(X,Y)+dCov(X,Z)
and overall,
Cov(aW+bX,cY+dZ)=acCov(W,Y)+adCov(W,Z)+bcCov(X,Y)+bdCov(X,Z)
You can then use this to prove the (non-linear) results for variance that you wrote in your post:
Var(aX)=Cov(aX,aX)=a2Cov(X,X)=a2Var(X)
Var(aX+bY)Var(aX+bY)=Cov(aX+bY,aX+bY)=a2Cov(X,X)+abCov(X,Y)+baCov(X,Y)+b2Cov(Y,Y)=a2Var(X)+b2Var(Y)+2abCov(X,Y)
The latter gives, as a special case when a=b=1,
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)
When X and Y are uncorrelated (which includes the case where they are independent), then this reduces to Var(X+Y)=Var(X)+Var(Y).
So if you want to manipulate variances in a "linear" way (which is often a nice way to work algebraically), then work with the covariances instead, and exploit their bilinearity.