Sayangnya, pertanyaan ini tidak memiliki jawaban yang bagus. Anda dapat memilih model terbaik berdasarkan fakta bahwa ia meminimalkan kesalahan absolut, kesalahan kuadrat, memaksimalkan kemungkinan, menggunakan beberapa kriteria yang menghukum kemungkinan (misalnya AIC, BIC) untuk menyebutkan hanya beberapa pilihan paling umum. Masalahnya adalah bahwa tidak satu pun dari kriteria itu akan membiarkan Anda memilih model terbaik yang objektif, tetapi lebih baik dari yang Anda membandingkan. Masalah lain adalah bahwa sementara mengoptimalkan Anda selalu dapat berakhir di beberapa lokal maksimum / minimum. Namun masalah lain adalah bahwa pilihan Anda untuk kriteria pemilihan model adalah subyektif . Dalam banyak kasus Anda secara sadar, atau setengah sadar, membuat keputusan tentang apa yang Anda minati dan memilih kriteria berdasarkan ini. Sebagai contoh , menggunakan BIC daripada AIC mengarah ke model yang lebih pelit, dengan lebih sedikit parameter. Biasanya, untuk pemodelanAnda tertarik pada model yang lebih pelit yang mengarah pada beberapa kesimpulan umum tentang alam semesta, sedangkan untuk memprediksinya tidak harus begitu dan kadang-kadang model yang lebih rumit dapat memiliki kekuatan prediksi yang lebih baik (tetapi tidak harus dan seringkali tidak) . Dalam kasus lain, kadang-kadang model yang lebih rumit lebih disukai karena alasan praktis , misalnya saat memperkirakan model Bayesian dengan MCMC, model dengan hyperpriors dapat berperilaku lebih baik dalam simulasi daripada yang lebih sederhana. Di sisi lain, umumnya kita takut overfitting hierarkis dan model yang lebih sederhana memiliki risiko lebih rendah dari overfitting, sehingga merupakan pilihan yang lebih aman. Contoh yang bagus untuk ini adalah pemilihan model bertahap otomatis yang umumnya tidak direkomendasikan karena mudah mengarah pada perkiraan yang berlebihan dan bias. Ada juga argumen filosofis,pisau cukur Occam , bahwa model yang paling sederhana adalah yang paling disukai. Perhatikan juga, yang sedang kita bahas di sini membandingkan model yang berbeda, sementara dalam situasi kehidupan nyata juga bisa sehingga menggunakan alat statistik yang berbeda dapat menghasilkan hasil yang berbeda - sehingga ada lapisan tambahan dalam memilih metode!
Semua ini mengarah pada fakta yang menyedihkan, namun menghibur, yang tidak pernah bisa kami yakini. Kita mulai dengan ketidakpastian, menggunakan metode untuk menghadapinya dan kita berakhir dengan ketidakpastian. Ini mungkin paradoks, tetapi ingat bahwa kita menggunakan statistik karena kita percaya bahwa dunia tidak pasti dan probabilistik (jika tidak kita akan memilih karier para nabi), jadi bagaimana mungkin kita bisa berakhir dengan kesimpulan yang berbeda? Tidak ada aturan penghentian yang objektif, ada beberapa model yang mungkin, semuanya salah (maaf untuk klise!) Karena mereka mencoba untuk menyederhanakan realitas yang rumit (terus berubah dan probabilistik). Kami menemukan beberapa dari mereka lebih berguna daripada yang lain untuk tujuan kami dan kadang-kadang kami lakukanmenemukan model yang berbeda berguna untuk tujuan yang berbeda. Anda dapat pergi ke paling bawah untuk memperhatikan bahwa dalam banyak kasus kami membuat model yang tidak diketahuiθItu, yang dalam banyak kasus tidak pernah bisa diketahui, atau bahkan tidak ada (apakah populasi memilikiμuntuk usia?). Sebagian besar model bahkan tidak mencoba menggambarkan realitas tetapi memberikan abstraksi dan generalisasi, sehingga mereka tidak bisa "benar", atau "benar".
Anda dapat melangkah lebih dalam dan menemukan bahwa tidak ada yang namanya "probabilitas" dalam kenyataan - itu hanya beberapa perkiraan ketidakpastian di sekitar kita dan ada juga cara alternatif untuk memperkirakannya seperti misalnya logika fuzzy (lihat Kosko, 1993 untuk diskusi). Bahkan alat dan teorema yang sangat mendasar yang menjadi dasar metode kita adalah perkiraan dan bukan satu-satunya yang mungkin. Kami tidak bisa memastikan pengaturan seperti itu.
Aturan berhenti yang Anda cari selalu spesifik masalah dan subyektif, yaitu berdasarkan penilaian profesional. Ngomong-ngomong, ada banyak contoh penelitian yang menunjukkan bahwa para profesional sering kali tidak lebih baik dan kadang-kadang bahkan lebih buruk dalam penilaian mereka daripada orang awam (misalnya dihidupkan kembali dalam makalah dan buku-buku oleh Daniel Kahneman ), sambil lebih cenderung terlalu percaya diri (ini sebenarnya argumen tentang mengapa kita tidak mencoba untuk "yakin" tentang model kita).
Kosko, B. (1993). Pemikiran fuzzy: ilmu baru logika fuzzy. New York: Hyperion.