Bagaimana saya mengulangi pertanyaan ini secara statistik


8

Saya menganalisis dataset yang berisi pengamatan dari n sejumlah upaya oleh pemain dalam sebuah permainan. Jika saya membangun model regresi untuk memprediksi hasil dari setiap upaya yang diberikan 1 atau lebih deskriptor mengenai upaya masing-masing pemain , bagaimana cara mengukur berapa banyak upaya pemain harus sebelum deskriptor tertentu menjadi "bermakna" atau "signifikan" diberikan dataset kami ?

Contoh yang baik adalah sekelompok orang yang bermain panah. Seorang pemula yang absolut mungkin akan menutup matanya, melempar panah, dan mengenai mata banteng. Jelas, kita tahu itu adalah kesempatan murni, dia belum pernah bermain sebelumnya, dan heck, dia bahkan mungkin mabuk. Tetapi katakanlah dia melempar 5 anak panah lebih banyak dan memukul mata seekor banteng 3 kali lebih banyak dari mereka 5. Dia sekarang telah melemparkan 6 anak panah dan mengenai mata banteng 50% dari waktu. Sekarang semuanya mulai mencurigakan ...

Pada titik apakah pemula sejati ini melempar panah mata banteng yang cukup, dan berapa banyak upaya yang dia butuhkan sebelum kita dapat mengatakan dia memiliki bakat serius di atas pemain yang lebih berpengalaman lainnya? Apa istilah ini dalam statistik dan di mana saya bisa belajar lebih banyak tentang itu?

Penafian: Saya mencoba untuk menghindari penggunaan istilah statistik yang dimuat seperti "signifikansi" dan "pengamatan" sebanyak mungkin, meskipun saya merasa mereka sesuai di tempat-tempat tertentu di sini.

Jika ada yang bisa mengarahkan saya ke arah yang benar, itu akan fantastis. Terima kasih!!


2
Anda hanya beberapa langkah lagi dari menjadi seorang Bayesian ...
Marcelo Ventura

Jadi ini pertanyaan interval kepercayaan karena lebih banyak anak panah dilemparkan, sampai tingkat tertentu?
KidMcC

Apa yang Anda lihat mungkin merupakan pengujian berurutan. Atau, Anda mungkin ingin menghitung kekuatan statistik, yaitu berapa banyak sampel yang perlu Anda gambar untuk mengurangi kesalahan beta; perhatikan bahwa ketika Anda melihat satu pemain tertentu sampel tidak independen. Semua ini juga bisa secara alami tertanam dalam kerangka bayesian, seperti kata komentator pertama.
Regenschein

Adaptif dan berurutan adalah dua kata kunci yang bermanfaat.
Whuber

Jawaban:


1

Darts adalah gim yang paling sederhana. Setiap pemain mulai dengan skor 501 dan bergantian untuk melemparkan 3 anak panah. Skor untuk setiap belokan dihitung dan dikurangkan dari total pemain. Bullseye skor 50, cincin luar skor 25 dan panah di dobel atau treble menghitung ganda atau treble skor segmen.

Gambar dari http://www.shotdarts.com/darts-info/play-darts

Sekarang probabilitas telah diperiksa di tempat lain . Di situs itu, kita diberi tahu "Seorang pemain dart yang memiliki keterampilan sedang akan memiliki standar deviasi yang lebih besar; walaupun tembakan mungkin, secara rata-rata, berpusat di sekitar target yang sama, mereka akan didistribusikan di wilayah yang lebih luas. Seorang pemain dart yang buruk akan memiliki standar deviasi yang tinggi dan tembakan mereka akan, secara probabilistik, tersebar di wilayah yang jauh lebih luas. " Yaitu skor dart,.

Jadi, untuk menjawab pertanyaan, kami melakukan apa yang selalu kami lakukan. Kami membangun histogram skor, dan untuk permainan itu sendiri kami mungkin menggunakan skor 501, dan kemudian kami cocok dengan fungsi kerapatan, dan kemudian kami menguji fungsi kerapatan terhadap fungsi kerapatan pemain lain. Jadi, kami membutuhkan data yang cukup sehingga lokasi kami dan penyimpangannya memiliki kekuatan prediksi yang cukup untuk membedakan dengan benar antara pemain. Semakin sedikit data, semakin kabur jawaban, dan tidak ada angka ajaib untuk itu, semakin banyak semakin meriah.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.