Ya, kita bisa mendapatkan hasil yang analog menggunakan mean sampel dan varians, dengan mungkin, beberapa kejutan kecil muncul dalam proses.
Pertama, kita perlu sedikit memperbaiki pernyataan pertanyaan dan menetapkan beberapa asumsi. Yang penting, harus jelas bahwa kita tidak bisa berharap untuk mengganti varians populasi dengan varians sampel di sisi kanan karena yang terakhir adalah acak ! Jadi, kami memfokuskan kembali perhatian kami pada ketimpangan setara
Dalam hal tidak jelas bahwa ini adalah setara, perhatikan bahwa kami hanya mengganti t dengan t σ dalam ketidaksetaraan awal tanpa kehilangan secara umum.
P(X−EX≥tσ)≤11+t2.
ttσ
Kedua, kita asumsikan bahwa kita memiliki sampel acak dan kami tertarik dalam batas atas untuk analog kuantitas
P ( X 1 - ˉ X ≥ t S ) , di mana ˉ X adalah sampel mean dan S adalah standar deviasi sampel.X1,…,XnP(X1−X¯≥tS)X¯S
Setengah langkah ke depan
X1−X¯
P(X1−X¯≥tσ)≤11+nn−1t2
σ2=Var(X1)σS
Versi sampel Chebyshev satu sisi
X1,…,XnP(S=0)=0
P(X1−X¯≥tS)≤11+nn−1t2.
Xi
Yi=Xi−X¯
P(Y1≥tS)=1n∑i=1nP(Yi≥tS)=E1n∑i=1n1(Yi≥tS).
c>0{S>0}
1(Yi≥tS)=1(Yi+tcS≥tS(1+c))≤1((Yi+tcS)2≥t2(1+c)2S2)≤(Yi+tcS)2t2(1+c)2S2.
Kemudian,
karena dan .
1n∑i1(Yi≥tS)≤1n∑i(Yi+tcS)2t2(1+c)2S2=(n−1)S2+nt2c2S2nt2(1+c)2S2=(n−1)+nt2c2nt2(1+c)2,
Y¯=0∑iY2i=(n−1)S2
Sisi kanan adalah konstanta ( ! ), Jadi dengan mengambil ekspektasi pada hasil kedua sisi,
Akhirnya, meminimalkan lebih dari , menghasilkan , yang setelah sedikit aljabar menetapkan hasilnya.
P(X1−X¯≥tS)≤(n−1)+nt2c2nt2(1+c)2.
cc=n−1nt2
Kondisi teknis yang sial itu
Perhatikan bahwa kita harus mengasumsikan agar dapat dibagi dengan dalam analisis. Ini bukan masalah untuk distribusi yang benar-benar kontinu, tetapi menimbulkan ketidaknyamanan untuk yang terpisah. Untuk distribusi diskrit, ada beberapa kemungkinan bahwa semua pengamatan adalah sama, dalam hal ini untuk semua dan .P(S=0)=0S20=Yi=tS=0it>0
Kita dapat menggoyangkan jalan keluar kita dengan menetapkan . Kemudian, perhitungan argumen yang cermat menunjukkan bahwa semuanya berjalan hampir tidak berubah dan kita dapatkanq=P(S=0)
Konsekuensi 1 . Untuk kasus , kami memilikiq=P(S=0)>0
P(X1−X¯≥tS)≤(1−q)11+nn−1t2+q.
Bukti . Berpisah pada acara dan . Bukti sebelumnya berlaku untuk dan case sepele.{S>0}{S=0}{S>0}{S=0}
Ketidaksetaraan sedikit lebih baik jika kita mengganti ketidaksetaraan nonstrik dalam pernyataan probabilitas dengan versi yang ketat.
Konsekuensi 2 . Misalkan (mungkin nol). Kemudian,q=P(S=0)
P(X1−X¯>tS)≤(1−q)11+nn−1t2.
Pernyataan akhir : Versi sampel ketimpangan yang diperlukan tidak ada asumsi (selain itu tidak hampir-pasti konstan dalam kasus nonstrict ketimpangan, yang versi aslinya juga diam-diam mengasumsikan), pada dasarnya, karena sampel mean dan sampel varians selalu ada apakah analog populasi mereka lakukan atau tidak.X