Saya baru saja menyaksikan kuliah tentang kesimpulan statistik ("membandingkan proporsi dan cara"), bagian dari kursus pengantar statistik online. Materi itu membuat sedikit masuk akal bagi saya seperti biasa (sekarang saya pasti telah melihat hal ini puluhan kali, tersebar selama tiga dekade terakhir).
Saya sedang mencari buku tentang "Stats-101" dasar (estimasi titik, penilaian estimasi, inferensi statistik, pengujian hipotesis, desain studi) yang menangani masalah serius meyakinkan pembaca yang skeptis ...
Di bawah ini saya memberikan beberapa contoh jenis pertanyaan yang penulis cari akan menganggap serius dan tahu bagaimana mengatasinya dengan meyakinkan.
Tetapi pertama-tama izinkan saya meluangkan waktu untuk menekankan bahwa dalam posting ini saya tidak menanyakan pertanyaan-pertanyaan ini. Tolong, jangan jawab mereka! Saya memberi mereka hanya sebagai contoh, dan dengan cara "tes lakmus" (untuk jenis penulis mencari).
Jika "proporsi" hanyalah rata - rata dari variabel Boolean (yaitu yang hanya mengambil nilai 0 dan 1), mengapa prosedur yang berbeda diajarkan untuk melakukan inferensi statistik dengan "proporsi" dan dengan "berarti"?
Jika distribusi normal sangat kuat sehingga asumsi normalitas memberikan hasil yang baik bahkan dalam kasus ketika data tersebut tidak terdistribusi secara normal, dan jika distribusi-t terlihat sangat normal, mengapa semua kerepotan tentang menggunakan distribusi-t alih-alih normal?
Apa sebenarnya "derajat kebebasan", dan mengapa kita mengkhawatirkannya?
Apa artinya berbicara tentang nilai "benar" dari suatu parameter, mengingat kita hanya menggunakan distribusi yang kebetulan terlihat mirip dengan data?
Kenapa "analisis data eksplorasi" adalah hal yang baik, sementara "pengintaian data" adalah hal yang jahat?
Seperti yang telah saya katakan, saya terhambat oleh sikap yang tersirat oleh pengabaian pertanyaan semacam itu. Bukan "sikap epistemologis" yang ingin saya lihat pada seseorang yang mengajari saya sesuatu. Saya mencari penulis yang menghargai skeptisisme dan rasionalitas pembaca, dan yang tahu bagaimana mengatasinya (tanpa harus pergi ke halaman dan halaman formalisme dan teknis).
Saya menyadari bahwa ini adalah hal yang sulit, dan mungkin terutama dalam hal statistik. Karena itu, saya tidak berharap banyak penulis akan berhasil. Tetapi pada saat ini saya akan puas dengan hanya menemukan satu .
Biarkan saya menambahkan bahwa saya tidak suka matematika. Sebaliknya, saya suka matematika. (Saya nyaman dengan analisis [alias "kalkulus lanjut"], aljabar linier, teori probabilitas, bahkan teori ukuran dasar.)
Yang mengatakan, minat saya saat ini adalah dalam statistik "diterapkan", "praktis", "sehari-hari", "dunia nyata" (sebagai lawan dari kebaikan teoritis). (Tapi aku juga tidak mau buku masak!)
FWIW, saya telah membaca beberapa bab pertama dari analisis data menggunakan regresi dan model multilevel / hierarkis oleh Gelman dan Hill, dan saya menyukai nada penulis. Fokus mereka praktis, tetapi masuklah ke teori ketika dibutuhkan. Mereka juga sering melangkah mundur, dan menilai praktik standar secara kritis, dan menawarkan pendapat jujur yang menarik bagi akal sehat pembaca yang skeptis. Sayangnya, para penulis ini belum menulis buku yang ditujukan untuk subjek yang saya tanyakan dalam posting ini (hal-hal "Statistik 101", seperti dijelaskan di atas). Saya juga sadar bahwa salah satu penulis ini (Gelman) ikut menulis analisis data Bayesian yang sangat dihormati , tetapi, sekali lagi, ini bukan yang saya cari saat ini.
EDIT:
Dikran Marsupial mengajukan keberatan berikut:
Saya tidak berpikir ada yang salah dengan mengabaikan pertanyaan, ada titik di mana mengatasi setiap pertanyaan mengurangi eksposisi konsep-konsep dasar yang sering lebih penting (terutama dalam buku statistik 101!).
Saya setuju dengan itu. Akan lebih akurat bagi saya untuk mengatakan bahwa saya sedang mencari "pandangan kedua pada statistik dasar." Bahkan, dengan ini sebagai motivasi saya, saya melihat buku-buku teks yang digunakan pada kursus pascasarjana tentang inferensi (katakanlah), dan menemukan bahwa mereka juga mengabaikan pertanyaan-pertanyaan seperti yang saya cantumkan. Kalaupun ada, mereka tampaknya kurang tertarik untuk menyelidiki pertanyaan-pertanyaan semacam itu (sehingga mereka dapat fokus pada hal-hal seperti kondisi untuk beberapa konvergensi-atau-ini-atau-itu ...).
Masalahnya adalah bahwa buku-buku yang lebih maju ditujukan kepada populasi pembaca yang sangat berbeda , di mana "skeptisisme orang luar" telah berkurang secara drastis. TKI, mereka yang mengambil statistik tingkat pascasarjana sudah melewati titik terganggu oleh pertanyaan yang mengganggu saya. Mereka tidak skeptis tentang hal-hal ini lagi. (Bagaimana mereka mengatasi skeptisisme? Mungkin ada beberapa yang tidak terlalu kritis sejak awal, terutama jika mereka mempelajari statistik mereka cukup awal - saya tahu saya sendiri bukan mahasiswa baru yang kritis, misalnya, meskipun saya tidak ambil statistik lalu. Yang lain mungkin memiliki guru yang mengisi di mana buku teks mereka gagal. Beberapa mungkin cukup pintar untuk mencari tahu jawaban atas pertanyaan-pertanyaan seperti itu untuk diri mereka sendiri. Siapa yang tahu.)