Bertentangan dengan jawaban lain, saya berpendapat bahwa Anda dapat mengatakan sesuatu tentang kemampuan Baut mengingat data yang tersedia. Pertama-tama, mari kita persempit pertanyaan Anda. Anda bertanya tentang manusia tercepat, tetapi karena ada perbedaan dalam distribusi kecepatan lari untuk pria dan wanita, di mana pelari wanita terbaik wanita tampaknya sedikit lebih lambat dari pelari pria terbaik, kita harus fokus pada pelari pria. Untuk mendapatkan beberapa data, kita bisa melihat kinerja tahun terbaik dalam 100 dijalankan dari 45 tahun terakhir . Ada beberapa hal yang perlu diperhatikan tentang data ini:
- Itu adalah waktu lari terbaik, jadi mereka tidak memberi tahu kita tentang kemampuan semua manusia, tetapi tentang kecepatan minimal yang dicapai.
- Kami berasumsi bahwa data ini mencerminkan sampel pelari terbaik di dunia. Sementara itu mungkin terjadi bahwa ada pelari yang lebih baik yang tidak berpartisipasi dalam kejuaraan, asumsi ini tampaknya cukup masuk akal.
Pertama, mari kita bahas bagaimana tidak menganalisis data ini. Anda dapat memperhatikan bahwa jika kami merencanakan waktu berjalan dengan waktu, kami akan mengamati hubungan linier yang kuat.
Ini dapat mengarahkan Anda untuk menggunakan regresi linier untuk memperkirakan seberapa banyak pelari yang lebih baik yang dapat kita amati di tahun-tahun mendatang. Namun ini akan menjadi ide yang sangat buruk , yang tidak terhindarkan akan membawa Anda pada kesimpulan bahwa dalam sekitar dua ribu tahun manusia akan dapat berlari 100 meter dalam nol detik, dan setelah itu mereka akan mulai mencapai waktu berjalan negatif! Ini jelas tidak masuk akal, karena kita dapat membayangkan bahwa ada semacam batas biologis dan fisik dari kapasitas kita, yang tidak kita ketahui.
X 1 , X 2 , ... , X n Y i Z 1 , Z 2 , ... , Z k - Z iY= maks ( X1, X2, ... , Xn)X1, X2, ... , XnYsayaZ1, Z2, ... , Zk- ZsayaIkuti distribusi GEV untuk minimas. Jadi kita bisa menyesuaikan distribusi GEV dengan data kecepatan lari, yang mengarah ke kecocokan yang cukup bagus (lihat di bawah).
Jika Anda melihat distribusi kumulatif yang disarankan oleh model, Anda akan melihat bahwa waktu berjalan terbaik oleh Usain Bolt adalah yang terendah1 %ekor distribusi. Jadi jika kita berpegang pada data ini, dan analisis contoh mainan ini, kita akan menyimpulkan bahwa waktu berlari yang jauh lebih kecil tidak mungkin (tapi jelas, mungkin). Masalah yang jelas dengan analisis ini adalah bahwa mengabaikan fakta bahwa kami melihat peningkatan tahun-ke-tahun dari waktu berjalan terbaik. Ini membawa kita kembali ke masalah yang dijelaskan di bagian pertama jawaban, yaitu mengasumsikan model regresi di sini berisiko. Hal lain yang dapat ditingkatkan adalah bahwa kita dapat menggunakan pendekatan Bayesian dan mengasumsikan informatif sebelumnya yang akan menjelaskan beberapa pengetahuan out-of-data tentang waktu berjalan fisiologis mungkin, yang mungkin belum diamati (tapi, sejauh yang saya tahu, ini tidak diketahui saat ini). Akhirnya, teori nilai ekstrim serupa sudah digunakan dalam penelitian olahraga, misalnya oleh Einmahl dan Magnus (2008) dalamCatatan dalam Atletik Melalui makalah Teori Nilai Ekstrim .
Anda dapat memprotes bahwa Anda tidak bertanya tentang probabilitas waktu berlari yang lebih cepat, tetapi tentang probabilitas mengamati pelari yang lebih cepat. Sayangnya, di sini kita tidak bisa berbuat banyak karena kita tidak tahu berapa probabilitas seorang pelari akan menjadi atlet profesional dan waktu lari yang tercatat akan tersedia baginya. Ini tidak terjadi secara acak dan ada banyak faktor yang berkontribusi pada kenyataan bahwa beberapa pelari menjadi atlet profesional dan beberapa tidak (atau bahkan seseorang suka berlari dan berlari sama sekali). Untuk ini, kita harus memiliki data rinci populasi-lebar tentang pelari, apalagi karena Anda bertanya tentang ekstrem distribusi, data harus sangat besar. Jadi, saya setuju dengan jawaban yang lain.