Saya akan mengajar statistik sebagai asisten pengajar untuk paruh kedua semester ini untuk mahasiswa sarjana berorientasi-CS. Sebagian besar siswa mengambil kelas tidak memiliki insentif untuk mempelajari subjek dan hanya mengambilnya untuk persyaratan utama. Saya ingin membuat subjek menarik dan bermanfaat, bukan hanya kelas yang mereka pelajari untuk mendapatkan B + untuk lulus.
Sebagai mahasiswa PhD matematika murni, saya hanya tahu sedikit tentang sisi kehidupan nyata yang diterapkan. Saya ingin meminta beberapa aplikasi statistik sarjana kehidupan nyata. Contoh yang saya cari adalah yang (dalam semangat) seperti:
1) Menampilkan teorema limit pusat berguna untuk data sampel besar tertentu.
2) Berikan contoh tandingan bahwa teorema batas pusat tidak berlaku (katakanlah, yang mengikuti distribusi Cauchy).
3) Menunjukkan bagaimana pengujian hipotesis bekerja dalam contoh kehidupan nyata yang terkenal menggunakan uji-Z, uji-t atau sesuatu.
4) Menunjukkan bagaimana overfitting atau salah hipotesis awal dapat memberikan hasil yang salah.
5) Menunjukkan bagaimana p-value dan interval kepercayaan bekerja dalam kasus kehidupan nyata (terkenal) dan di mana mereka tidak bekerja dengan baik.
6) Demikian pula tipe I, kesalahan tipe II, kekuatan statistik, tingkat penolakan , dll.
Masalah saya adalah bahwa sementara saya memiliki banyak contoh di sisi probabilitas (lemparan koin, lemparan dadu, kehancuran penjudi, martingales, jalan acak, paradoks tiga tahanan, masalah ruang monty, metode probabilitas dalam desain algoritma, dll), saya tidak tahu banyak contoh kanonik di sisi statistik. Yang saya maksud adalah contoh serius dan menarik yang memiliki nilai pedagogis, dan tidak dibuat-buat secara artifisial yang tampaknya sangat terlepas dari kehidupan nyata. Saya tidak ingin memberikan kesan yang salah kepada siswa bahwa tes-Z dan uji-t adalah segalanya. Tetapi karena latar belakang matematika murni saya, saya tidak tahu cukup contoh untuk membuat kelas menarik dan bermanfaat bagi mereka. Jadi saya mencari bantuan.
Tingkat murid saya adalah sekitar kalkulus I dan kalkulus II. Mereka bahkan tidak dapat menunjukkan varians normal standar adalah 1 menurut definisi karena mereka tidak tahu bagaimana mengevaluasi kernel Gaussian. Jadi segala sesuatu yang sedikit teoretis atau komputasi langsung (seperti distribusi hypergeometrik, hukum arcsin dalam 1D random walk) tidak akan berfungsi. Saya ingin menunjukkan beberapa contoh yang mereka dapat mengerti tidak hanya "bagaimana", tetapi juga "mengapa". Kalau tidak, saya tidak yakin apakah saya akan membuktikan apa yang saya katakan dengan intimidasi.