Ini bukan hal yang mudah, bahkan untuk ahli statistik yang dihormati. Lihatlah satu upaya terbaru oleh Nate Silver :
... jika saya meminta Anda untuk memberi tahu saya seberapa sering perjalanan Anda membutuhkan waktu 10 menit lebih lama dari rata-rata - sesuatu yang memerlukan beberapa versi interval kepercayaan - Anda harus memikirkannya sedikit, ...
(dari blog FiveThirtyEight di New York Times, 9/29/10.) Ini bukan interval kepercayaan diri. Bergantung pada bagaimana Anda menafsirkannya, itu adalah interval toleransi atau interval prediksi. (Kalau tidak, tidak ada masalah dengan diskusi Silver yang sangat baik tentang estimasi probabilitas; ini adalah bacaan yang bagus.) Banyak situs web lain (terutama yang dengan fokus investasi) juga mengacaukan interval kepercayaan dengan jenis interval lainnya.
The New York Times telah melakukan upaya untuk memperjelas arti dari hasil statistik yang dihasilkan dan dilaporkannya. Hasil cetak halus di bawah banyak jajak pendapat mencakup sesuatu seperti ini:
Secara teori, dalam 19 kasus dari 20, hasil berdasarkan sampel semua orang dewasa akan berbeda tidak lebih dari tiga poin persentase di kedua arah dari apa yang akan diperoleh dengan berusaha mewawancarai semua orang dewasa Amerika.
( misalnya , Bagaimana Polling Dilakukan , 5/2/2011.)
Sedikit bertele-tele, mungkin, tetapi jelas dan akurat: pernyataan ini mencirikan variabilitas dari distribusi sampling dari hasil polling. Itu semakin dekat dengan gagasan interval kepercayaan, tetapi tidak cukup di sana. Orang mungkin mempertimbangkan menggunakan kata-kata seperti itu sebagai pengganti interval kepercayaan dalam banyak kasus.
Ketika ada begitu banyak potensi kebingungan di internet, akan bermanfaat untuk beralih ke sumber-sumber resmi. Salah satu favorit saya adalah teks yang dihormati waktu, Statistik , Freedman, Pisani, & Purves . Sekarang dalam edisi keempat, telah digunakan di universitas selama lebih dari 30 tahun dan terkenal karena penjelasan yang jelas dan jelas dan fokus pada metode klasik "sering". Mari kita lihat apa yang dikatakan tentang menafsirkan interval kepercayaan:
Tingkat kepercayaan 95% mengatakan sesuatu tentang prosedur pengambilan sampel ...
[di hlm. 384; semua kutipan berasal dari edisi ketiga (1998)]. Itu berlanjut,
Jika sampel keluar secara berbeda, interval kepercayaan akan berbeda. ... Untuk sekitar 95% dari semua sampel, interval ... mencakup persentase populasi, dan untuk 5% lainnya tidak.
[hal. 384]. Teks ini mengatakan lebih banyak tentang interval kepercayaan, tetapi ini cukup untuk membantu: pendekatannya adalah memindahkan fokus diskusi ke sampel, sekaligus membawa ketegasan dan kejelasan pada pernyataan. Karena itu kami mungkin mencoba hal yang sama dalam pelaporan kami sendiri. Sebagai contoh, mari kita terapkan pendekatan ini untuk menggambarkan interval kepercayaan [34%, 40%] di sekitar perbedaan persentase yang dilaporkan dalam eksperimen hipotetis:
"Eksperimen ini menggunakan sampel subyek yang dipilih secara acak dan pemilihan kontrol secara acak. Kami melaporkan interval kepercayaan dari 34% hingga 40% untuk perbedaannya. Ini mengukur keandalan percobaan: jika pilihan subjek dan kontrol berbeda. , interval kepercayaan ini akan berubah untuk mencerminkan hasil untuk mata pelajaran dan kontrol yang dipilih. Dalam 95% dari kasus tersebut, interval kepercayaan akan mencakup perbedaan nyata (antara semua subjek dan semua kontrol) dan dalam 5% kasus lainnya tidak akan Karena itu, kemungkinan - tetapi tidak pasti - bahwa interval kepercayaan ini mencakup perbedaan sebenarnya: yaitu, kami percaya perbedaan sebenarnya adalah antara 34% dan 40%. "
(Ini adalah teks saya, yang pasti dapat diperbaiki: Saya mengundang editor untuk mengerjakannya.)
Pernyataan panjang seperti ini agak sulit digunakan. Dalam laporan aktual sebagian besar konteks - pengambilan sampel acak, subjek dan kontrol, kemungkinan variabilitas - sudah ditetapkan, membuat setengah dari pernyataan sebelumnya tidak diperlukan. Ketika laporan menyatakan bahwa ada variabilitas sampling dan menunjukkan model probabilitas untuk hasil sampel, biasanya tidak sulit untuk menjelaskan interval kepercayaan (atau interval acak lainnya) sejelas dan seketat yang dibutuhkan audiens.