Sudah cukup lama diketahui bahwa usia termuda di mana pemain catur berhasil lolos ke gelar grandmaster telah menurun secara signifikan sejak 1950-an, dan saat ini ada hampir 30 pemain yang menjadi grandmaster sebelum ulang tahun ke 15 mereka . Namun, ada pertanyaan di Chess Stack Exchange yang menanyakan, Berapa usia rata-rata untuk menjadi seorang grandmaster? .
Seseorang memposting jawaban yang dia (saya anggap itu dia) melihat enam himpunan bagian dari grandmaster dan menemukan hasil berikut:
- Untuk pemain yang lahir setelah 1945, rata-rata sedikit di atas 26 tahun.
- Untuk pemain yang lahir setelah tahun 1970, rata-rata sedikit di atas 23 tahun.
- Untuk pemain yang lahir setelah 1975, rata-rata sedikit di atas 22 tahun.
- Untuk pemain yang lahir setelah 1980, rata-rata adalah 21 tahun.
- Untuk pemain yang lahir setelah 1985, rata-rata hanya malu 20 tahun.
- Untuk pemain yang lahir setelah 1990, rata-rata berusia 18,5 tahun.
(Tidak sepenuhnya jelas bagi saya apakah, misalnya grup pertama berisi semua grandmaster yang lahir setelah 1945 (yang menjadikannya superset dari grup berikutnya) atau hanya mereka yang lahir antara 1945 dan 1970 (band usia). Saya pikir itu adalah mantan dan bahwa pertanyaan saya berlaku dalam kedua kasus.)
Masalahnya adalah bahwa pemain yang lahir setelah tahun 1990 lebih muda dari 26 ketika jawabannya diposting (Juli 2015), sehingga tidak mungkin untuk mendapatkan rata-rata "usia GM" dari 26. Subset termuda dalam jawaban secara alami memotong siapa pun yang lebih dari 25, sedangkan himpunan bagian "lama" tidak. Tidakkah ini membuat bias atau bias hasilnya? (Apakah ini jenis bias seleksi ? Saya tidak memiliki latar belakang dalam statistik, dan membaca beberapa entri Wikipedia yang terkait tidak membantu.) Jika ya, bagaimana seharusnya (atau dapat) ini dikurangi? Dalam kelompok "yang lebih tua", haruskah perhitungan rata-rata untuk kualifikasi gelar GM hanya mempertimbangkan pemain yang mendapat gelar sebelum usia 26?