Katakanlah saya memiliki seorang teman (sebut saja dia "George") yang mengatakan bahwa dia dapat mengendalikan lemparan dadu menggunakan pikirannya (yaitu, membuat dadu lebih mungkin jatuh pada angka tertentu yang dia pikirkan).
Bagaimana saya bisa merancang tes yang ketat secara ilmiah untuk menentukan apakah dia benar-benar dapat melakukan ini? (Saya tidak benar-benar berpikir dia bisa, tentu saja, tetapi saya ingin dia menyetujui rincian tes, Amazing Randi-style, sebelum tes dimulai.) Saya ingin mengurangi (sangat mungkin) post-test-alasan bahwa dia akan datang dengan.
Inilah yang saya miliki sejauh ini:
Tentukan teknik fisik dadu-linting (yang dadu, cangkir pengocok, permukaan pendaratan, dll)
Tentukan "sesi tes", yang terdiri dari X gulungan dadu. Ini harus cukup kecil untuk dilakukan dalam satu duduk, tetapi cukup besar untuk menentukan (setelah analisis) dalam kepercayaan 95% -99% apakah dadu jatuh adil, atau disukai satu sisi
Jalankan sesi Y pada dadu yang dipilih (tanpa pengaruh dari George), sebagai "kontrol" untuk memastikan bahwa dadu menunjukkan hasil "adil" sendiri
Jalankan sesi Z dengan George. Sebelum masing-masing, gulirkan dadu yang terpisah untuk menentukan angka apa yang akan "difokuskan" George selama seluruh sesi itu.
Kompilasi dan analisis hasilnya.
George membuat beberapa alasan untuk penampilannya yang suram.
Jadi pertanyaan saya untuk Anda:
Adakah kekurangan atau masalah dengan keseluruhan metodologi saya? Adakah yang George mungkin akan keberatan?
Haruskah saya menggunakan D6? Atau D20? Apakah itu penting? Apakah mati dengan lebih banyak wajah membutuhkan lebih banyak gulungan untuk menghasilkan hasil yang sama percaya diri? Atau sebaliknya? Saya lebih suka gulungan lebih sedikit daripada lebih banyak, karena pertimbangan praktis :)
Apa nilai yang masuk akal untuk X , Y , dan Z ? Mereka tidak sepenuhnya tidak berhubungan; jika nilai X yang saya pilih hanya memungkinkan kepercayaan 95% untuk satu sesi, maka 1 dari setiap 20 sesi bisa "gagal", bahkan tanpa pengaruh George
Bagaimana saya mendefinisikan "sukses" atau "kegagalan" untuk sesi individu? (Saya memang menemukan pertanyaan ini yang melewati rincian uji chi-squared, jadi saya pikir itu metodologi evaluasi saya, tetapi apa yang dimaksud dengan ambang batas kepercayaan yang masuk akal?)
Bagaimana cara menetapkan "sukses" atau "gagal" untuk keseluruhan tes? George mungkin "memenangkan" satu sesi secara kebetulan, tetapi berapa banyak sesi Z yang harus dia lewati untuk lulus seluruh tes?
Saya mungkin akan menganalisis hasil ini dalam spreadsheet MS Excel, jika itu ada bedanya.