Saya tidak yakin dari mana pertanyaan ini berasal: Cross Validated, atau The Workplace. Tapi pertanyaan saya agak terkait dengan statistik.
Pertanyaan ini (atau saya kira pertanyaan) muncul selama saya bekerja sebagai "magang ilmu data". Saya sedang membangun model regresi linier ini dan memeriksa plot residual. Saya melihat tanda heteroskedastisitas yang jelas. Saya ingat bahwa heteroskedastisitas mengubah banyak statistik uji seperti interval kepercayaan dan uji-t. Jadi saya menggunakan kuadrat terkecil tertimbang, mengikuti apa yang telah saya pelajari di perguruan tinggi. Manajer saya melihat itu dan menyarankan saya untuk tidak melakukan itu karena "Saya membuat segalanya menjadi rumit", yang sama sekali bukan alasan yang meyakinkan bagi saya.
Contoh lain adalah "menghapus variabel penjelas karena nilai p-nya tidak signifikan". Untuk menjadi, saran ini tidak masuk akal dari sudut pandang logis. Menurut apa yang telah saya pelajari, nilai-p yang tidak signifikan dapat disebabkan oleh berbagai alasan: kesempatan, menggunakan model yang salah, melanggar asumsi, dll.
Contoh lain adalah bahwa, saya menggunakan validasi k-fold cross untuk mengevaluasi model saya. Menurut hasilnya, jauh lebih baik daripada . Tapi kami memiliki lebih rendah untuk model 1, dan alasannya ada hubungannya dengan intersep . Supervisor saya, tampaknya, lebih suka model 2 karena memiliki lebih tinggi . Alasannya (seperti kuat, atau lintas-validasi adalah pendekatan pembelajaran mesin, bukan pendekatan statistik) sepertinya tidak cukup meyakinkan untuk mengubah pikiran saya.
Sebagai seseorang yang baru lulus kuliah, saya sangat bingung. Saya sangat bersemangat menerapkan statistik yang benar untuk memecahkan masalah dunia nyata, tetapi saya tidak tahu mana yang benar:
- Statistik yang saya pelajari sendiri salah, jadi saya hanya membuat kesalahan.
- Ada perbedaan besar antara statistik teoritis dan model bangunan di perusahaan. Dan meskipun teori statistik benar, orang tidak mengikutinya.
- Manajer tidak menggunakan statistik dengan benar.
Pembaruan pada 4/17/2017: Saya telah memutuskan untuk mengejar gelar Ph.D. dalam statistik. Terima kasih atas balasan Anda.