Misalkan adalah vektor yang diasumsikan memiliki distribusi multivariat dari mean yang tidak diketahui ( μ , μ , ... , μ ) dan matriks varians-kovarians yang diketahui Σ . Kami mengamati ( z 1 , z 2 , ... , z n ) dari distribusi ini dan ingin memprediksi z 0 dari informasi ini menggunakan prediktor linier yang tidak bias:(Z0,Z1,…,Zn)(μ,μ,…,μ)Σ(z1,z2,…,zn) z0
- Linear berarti prediksi harus berbentuk untuk koefisien λ i yang akan ditentukan. Koefisien-koefisien ini dapat bergantung paling banyak pada apa yang diketahui sebelumnya: yaitu, entri Σ .z0^=λ1z1+λ2z2+⋯+λnznλiΣ
Prediktor ini juga dapat dianggap sebagai variabel acak .Z0^=λ1Z1+λ2Z2+⋯+λnZn
- Tidak sesuai artinya harapan sama dengan rata-rata (tidak diketahui) μ .Z0^μ
Menuliskan sesuatu memberikan beberapa informasi tentang koefisien:
μ=E[Z0^]=E[λ1Z1+λ2Z2+⋯+λnZn]=λ1E[Z1]+λ2E[Z2]+⋯+λnE[Zn]=λ1μ+⋯+λnμ=(λ1+⋯+λn)μ.
Baris kedua adalah karena linearitas harapan dan sisanya adalah aljabar sederhana. Karena prosedur ini seharusnya berfungsi terlepas dari nilai , jelas koefisien harus dijumlahkan menjadi satu. Menulis koefisien dalam notasi vektor λ = ( λ i ) ′ , ini dapat ditulis dengan rapi 1 λ = 1 .μλ=(λi)′1λ=1
Di antara set semua prediktor linier yang tidak bias seperti itu, kami mencari satu yang menyimpang sesedikit mungkin dari nilai sebenarnya , diukur dalam ruang mean square. Ini, sekali lagi, adalah perhitungan. Itu bergantung pada bilinearitas dan simetri kovarians, yang penerapannya bertanggung jawab atas penjumlahan pada baris kedua:
E[(Z0^−Z0)2]=E[(λ1Z1+λ2Z2+⋯+λnZn−Z0)2]=∑i=1n∑j=1nλiλjvar[Zi,Zj]−2∑i=1nλivar[Zi,Z0]+var[Z0,Z0]=∑i=1n∑j=1nλiλjΣi,j−2∑i=1nλiΣ0,i+Σ0,0.
1λ=1
Zx0,…,xnZ(Z(x0),…,Z(xn))Zi=Z(xi)n+1xin+1
σ2OKΣ(Z0,…,Zn)z0
Rata-rata prediksi kami benar.
z0σOKz0
Jauh lebih banyak yang perlu dikatakan sebelum ini dapat diterapkan pada situasi praktis seperti memperkirakan permukaan dari data tepat waktu: kita memerlukan asumsi tambahan tentang bagaimana karakteristik statistik dari proses spasial bervariasi dari satu lokasi ke lokasi lain dan dari satu realisasi ke yang lain (walaupun , dalam praktiknya, biasanya hanya satu realisasi yang akan tersedia). Tetapi penjelasan ini harus cukup untuk mengikuti bagaimana pencarian untuk Predictor Linear Tidak Berfungsi "Terbaik" ("BLUP") mengarah langsung ke sistem persamaan linear.
ΣΣΣdan memprediksi kumpulan nilai di lokasi yang tidak diketahui. Mereka membutuhkan asumsi yang sedikit lebih kuat (normalitas multivarian) untuk mencapai prestasi ini.