Saya memiliki data tentang serangkaian taruhan menang dan kalah lebih dari 5 putaran taruhan dengan gesekan setelah setiap putaran. Saya menggunakan pohon keputusan seperti berikut untuk menampilkan data.
Node menuju bagian atas pohon adalah mereka yang memiliki taruhan yang menang, dan mereka yang berada di bagian bawah pohon mengalami penurunan taruhan. Saya ingin melihat (a) gesekan pada setiap node (b) perubahan ukuran taruhan rata-rata di setiap node. Saya melihat tingkat gesekan pada setiap simpul dari simpul sebelumnya, dan tingkat kelangsungan hidup (menggunakan jumlah orang yang diharapkan pada setiap simpul jika probabilitasnya adalah 50%). Misalnya, jika probabilitasnya adalah 50% pada setiap simpul, dari 1000 yang dimulai, kira-kira 500 orang harus berada di masing-masing simpul kedua, W dan L. Hipotesisnya adalah (a) tingkat gesekan lebih tinggi setelah kehilangan taruhan (b) ukuran taruhan rata-rata dikurangi setelah kalah dan meningkat setelah pemenang.
Saya hanya ingin melakukan ini dalam pengaturan univariat yang sangat sederhana terlebih dahulu. Bagaimana saya bisa melakukan uji-t untuk menunjukkan perubahan dalam ukuran taruhan rata-rata dari simpul WW ke simpul WWW secara statistik signifikan jika 50 orang keluar? Saya tidak yakin ini adalah pendekatan yang tepat: setiap taruhan berikutnya independen, tetapi orang-orang keluar setelah kalah, sehingga sampel tidak cocok. Jika itu hanya kasus dari kelas yang sama mengambil serangkaian ujian satu demi satu tanpa putus, saya akan mengerti bagaimana melakukan uji-t yang sesuai, tetapi saya pikir ini sedikit berbeda.
Bagaimana saya bisa melakukan ini? Juga, jika hasilnya miring oleh sejumlah kecil pelanggan, bagaimana saya bisa mengambil 5% teratas dan 5% terbawah? Hapus saja pelanggan dengan ukuran saham kumulatif tertinggi dari taruhan 1 - 3?
Saya memiliki data dari mana angka itu dihasilkan, jadi saya memiliki rata-rata, std, std error dll di setiap node.