Kemandirian adalah konsep statistik. Dua variabel acak dan Y secara statistik independen jika distribusi bersama mereka adalah produk dari distribusi marginal, yaitu
f ( x , y ) = f ( x ) f ( y )
jika setiap variabel memiliki kepadatan f , atau lebih umum
F ( x , y ) = F ( x ) F ( y ) di
mana FXY
f(x,y)=f(x)f(y)
fF(x,y)=F(x)F(y)
F menunjukkan fungsi distribusi kumulatif masing-masing variabel acak.
Korelasi adalah konsep statistik yang lebih lemah tetapi terkait. Korelasi (Pearson) dari dua variabel acak adalah harapan dari produk dari variabel standar, yaitu
Variabel tidakberkorelasijikaρ=0. Dapat ditunjukkan bahwa dua variabel acak yang independen tidak berkorelasi, tetapi tidak sebaliknya.
ρ=E[X−E[X]E[(X−E[X])2]−−−−−−−−−−−−√Y−E[Y]E[(Y−E[Y])2]−−−−−−−−−−−−√].
ρ=0
Orthogonality adalah konsep yang berasal dari geometri, dan digeneralisasikan dalam aljabar linier dan bidang matematika terkait. Dalam aljabar linier, ortogonalitas dua vektor dan v didefinisikan dalam ruang hasilkali dalam , yaitu vektor ruang dengan produk dalam ⟨ u , v ⟩ , sebagai kondisi yang
⟨ u , v ⟩ = 0.
Produk dalam dapat didefinisikan dalam cara yang berbeda (menghasilkan ruang produk dalam yang berbeda). Jika vektor diberikan dalam bentuk urutan angka, u =uv⟨u,v⟩
⟨u,v⟩=0.
. , maka pilihan yang khas adalah
dot produk,
⟨ u , v ⟩ = Σ n i = 1 u i v iu=(u1,u2,…un)⟨u,v⟩=∑ni=1uivi
Karenanya, Orthogonality bukan konsep statistik semata, dan kebingungan yang Anda amati kemungkinan disebabkan oleh perbedaan terjemahan konsep aljabar linier ke statistik:
a) Secara formal, ruang variabel acak dapat dianggap sebagai ruang vektor. Maka dimungkinkan untuk mendefinisikan produk dalam di ruang itu, dengan cara yang berbeda. Satu pilihan umum
⟨X,Y⟩=cov(X,Y)=E[(X−E[X])(Y−E[Y])].
Karena korelasi dari dua variabel acak adalah nol persis jika kovarians adalah nol,
menurut definisi ini tidak berkorelasi sama dengan ortogonalitas. (Kemungkinan lain adalah mendefinisikan produk dalam variabel acak hanya sebagai
harapan produk .)
b) Tidak semua variabel yang kami pertimbangkan dalam statistik adalah variabel acak. Khususnya dalam regresi linier, kami memiliki variabel independen yang tidak dianggap acak tetapi sudah ditentukan sebelumnya. Variabel independen biasanya diberikan sebagai urutan angka, yang ortogonalitas secara alami didefinisikan oleh produk titik (lihat di atas). Kami kemudian dapat menyelidiki konsekuensi statistik dari model regresi di mana variabel independen berada atau tidak ortogonal. Dalam konteks ini, ortogonalitas tidak memiliki definisi statistik khusus, dan bahkan lebih: itu tidak berlaku untuk variabel acak.
Penambahan menanggapi komentar Silverfish : Orthogonality tidak hanya relevan sehubungan dengan regressor asli tetapi juga berkenaan dengan kontras, karena (set) kontras sederhana (ditentukan oleh vektor kontras) dapat dilihat sebagai transformasi dari matriks desain, yaitu set variabel independen, ke dalam set variabel independen yang baru. Orthogonality untuk kontras didefinisikan melalui produk titik. Jika regressor asli adalah saling ortogonal dan satu berlaku kontras ortogonal, para regressor baru juga saling ortogonal. Ini memastikan bahwa rangkaian kontras dapat dilihat sebagai menggambarkan dekomposisi varians, misalnya menjadi efek utama dan interaksi, ide yang mendasari ANOVA .
Karena menurut varian a), tidak berkorelasi dan ortogonalitas hanyalah nama yang berbeda untuk hal yang sama, menurut pendapat saya yang terbaik adalah menghindari menggunakan istilah dalam pengertian itu. Jika kita ingin berbicara tentang tidak berkorelasinya variabel acak, anggap saja demikian dan jangan mempersulit masalah dengan menggunakan kata lain dengan latar belakang yang berbeda dan implikasi yang berbeda. Ini juga membebaskan istilah ortogonalitas yang akan digunakan sesuai dengan varian b), yang sangat berguna terutama dalam membahas regresi berganda. Dan sebaliknya, kita harus menghindari penerapan korelasi istilah untuk variabel independen, karena mereka bukan variabel acak.
r
Saya telah menyebarkan tautan ke jawaban atas dua pertanyaan terkait di seluruh teks di atas, yang seharusnya membantu Anda memasukkannya ke dalam konteks jawaban ini.