@ Ferdi sudah memberikan jawaban yang jelas untuk pertanyaan Anda, tetapi mari kita membuatnya sedikit lebih formal.
Mari menjadi sampel Anda variabel acak independen dan terdistribusi secara identik dari distribusi . Anda tertarik untuk memperkirakan kuantitas yang tidak diketahui tetapi tetap , menggunakan estimator sebagai fungsi . Karena adalah fungsi dari variabel acak, perkirakanX1,…,XnFθg X 1 , ... , X n g gX1,…,Xng
θ^n=g(X1,…,Xn)
juga merupakan variabel acak. Kami mendefinisikan bias sebagai
bias(θ^n)=Eθ(θ^n)−θ
estimator tidak bias ketika .Eθ(θ^n)=θ
Mengatakannya dalam bahasa Inggris sederhana: kita berurusan dengan variabel acak , jadi kecuali jika itu merosot , jika kita mengambil sampel yang berbeda, kita bisa berharap untuk mengamati data yang berbeda dan perkiraan yang berbeda pula. Meskipun demikian, kita bisa berharap bahwa di seluruh sampel yang berbeda "rata-rata" diperkirakan akan "benar" jika estimatornya tidak bias. Jadi itu tidak akan selalu benar, tetapi "rata-rata" itu akan benar. Ini tidak selalu selalu "benar" karena keacakan terkait dengan data.θ^n
Seperti yang telah dicatat oleh orang lain, fakta bahwa estimasi Anda menjadi "lebih dekat" dengan jumlah yang diperkirakan saat sampel Anda tumbuh, yaitu bahwa dalam konvergensi dalam probabilitas
θ^n→Pθ
berkaitan dengan konsistensi penduga , bukan ketidakberpihakan. Ketidakcocokan saja tidak memberi tahu kami apa pun tentang ukuran sampel dan hubungannya dengan perkiraan yang diperoleh. Selain itu, penaksir yang tidak bias tidak selalu tersedia dan tidak selalu lebih disukai daripada yang bias. Misalnya, setelah mempertimbangkan pengorbanan varians-ragam, Anda mungkin bersedia mempertimbangkan untuk menggunakan estimator dengan bias yang lebih besar, tetapi varians yang lebih kecil - jadi "rata-rata" akan lebih jauh dari nilai sebenarnya, tetapi lebih sering (varians lebih kecil) estimasi akan lebih dekat ke nilai sebenarnya, maka dalam hal penduga tidak bias.