Pengantar statistik non-parametrik


11

Saya telah mempelajari statistik selama dua tahun terakhir. Hampir semua yang saya pelajari adalah tentang statistik parametrik. Sekarang saya ingin mempelajari lebih lanjut tentang statistik non-parametrik. Adakah yang bisa menyarankan beberapa pengantar singkat (mungkin dapat dibaca juga) ke daerah ini?

Jawaban:


12

Itu tergantung pada apa yang Anda maksud dengan 'ringkas', seperti apa tingkat perawatan yang Anda cari (termasuk konsep matematika dan intuisi), teknik apa yang ingin Anda sertakan.

Saya sangat menyarankan mulai dengan buku, dan membaca lebih dari satu buku .

" Statistik Praktis Nonparametrik " dari Conover adalah bagus, dan saya akan cenderung untuk memasukkannya ke dalam daftar mana pun.

" Statistik Nonparametrik Terapan " dari Daniel sangat bagus, cukup komprehensif untuk ukurannya.

Saya menemukan " Tes Distribusi Bebas " Neave dan Worthington sangat mudah dibaca ketika pertama kali keluar (dan dalam banyak hal masih demikian). Saat ini kode di dalamnya terlihat agak ketinggalan zaman, tetapi di sisi lain, umumnya cukup mudah untuk diterjemahkan. Jika Anda bisa menemukannya, itu adalah pengantar yang bagus; yang berharga untuk mengambil tangan kedua jika Anda tidak membelinya baru.

Ada lusinan buku bagus, beberapa lebih tua dari tiga yang saya sebutkan, beberapa lebih baru; beberapa mungkin lebih cocok untuk Anda daripada yang saya sebutkan. Saya akan mulai dengan perpustakaan universitas dan menelusuri pencarian dengan istilah-istilah seperti pada judul di atas, dan jika mungkin, lihat apa yang ada di dekatnya.

Baca beberapa dari mereka dan temukan beberapa yang Anda suka.

Ketika saya melakukan nonparametrik sebagai sarjana, ada sekitar delapan buku dalam bacaan yang disarankan, mungkin lebih. Masing-masing dari mereka memiliki sesuatu yang sebagian besar kekurangan. Aku senang bisa melihat semuanya.


4

Jika bidang studi Anda dalam ilmu-ilmu lunak (misalnya, psikologi, sosiologi, pendidikan), saya akan merekomendasikan Statistik Nonparametrik untuk Ilmu Perilaku oleh Siegel dan Castellan (Perusahaan Buku McGraw-Hill). (Saya memiliki edisi kedua dari tahun 1988). Dari kata pengantar:

Fitur khusus adalah garis besar langkah demi langkah penerapan setiap prosedur untuk data aktual.


2

Saya menemukan "Regresi Semiparametrik" oleh Carroll, Wand et al. cukup mudah dibaca. Itu sudah ketinggalan zaman, tetapi hal yang baik untuk memulai sebelum beralih ke buku singkat Simon Wood yang padat tentang GAM.

Kedua buku ini fokus pada model regresi spline yang dihukum, yang bukan segalanya dalam statistik nonparametrik. Namun bisa dibilang paling bermanfaat bagi orang yang menerapkan.


1
20826: dengan penjelasan, kalau-kalau Anda menemukan jawaban ini agak membingungkan - 'nonparametric' dapat merujuk tidak hanya untuk bentuk fungsional yang tidak ditentukan (berpotensi tak terbatas) untuk distribusi (yaitu Anda tidak menentukan bentuk parametrik untuk ), tetapi juga untuk hubungan antar variabel ( ). Jawaban ACD di sini mengacu pada yang kedua dan bukan yang pertama. Ini sebenarnya mungkin untuk istilah 'nonparametrik' dalam kaitannya dengan model regresi untuk diterapkan pada salah satu masalah, atau bahkan keduanya pada waktu yang sama (yang saya sebut 'nonparametric ganda'). FY(y)E(Y)=g(x)
Glen_b -Reinstate Monica

Baik. hanya ingin tahu, apa saja contoh contoh dalam pekerjaan terapan di mana yang pertama dari dua bentuk karya nonparametrik mungkin berguna? atau saya kira bootstrap akan menjadi contoh, bukan?
generic_user

1
ACD, saya sarankan Anda melihat salah satu buku yang disebutkan dalam jawaban saya. Saya bisa menunjukkan - secara harfiah - ke ribuan makalah yang menerapkannya pada masalah nyata, yang meliputi tes Wilcoxon-Mann-Whitney, tes goodness of fit seperti Kolmogorov-Smirnov, langkah-langkah korelasi seperti Kendall dan Spearman, regresi Theil-Sen , Kurva survival Kaplan-Meier (dan uji log-rank), permutasi / pengacakan (+ metode resampling lainnya) & banyak lagi hal semacam itu. Secara keseluruhan, saya katakan mungkin sebenarnya diterapkan sedikit lebih sering daripada arti Anda menggunakannya. Ya, bootstrap sudah termasuk.
Glen_b -Reinstate Monica

1
(ctd) ... daerahnya cukup besar; jika Anda mempersempitnya sedikit saya mungkin dapat menemukan Anda beberapa aplikasi tertentu.
Glen_b -Reinstate Monica

1
Benar, jadi ini umumnya tes yang tidak bergantung pada asumsi distribusi. Saya kira saya bertanya-tanya apakah seseorang dapat memperkirakan distribusi nonparametrik untuk model pada saat yang sama dengan memperkirakan hubungan antara variabel (mungkin dengan banyak data). Tetapi, seperti yang Anda tunjukkan, ada banyak yang harus dibaca.
generic_user

2

Saya terkejut tidak melihat Statistik Statistik Nonparametrik Semua Larry Wasserman disebutkan.

Saya pikir ini adalah buku yang bagus dengan ukuran relatif ringkas. Terutama jika seseorang sudah memiliki latar belakang dalam statistik parametrik, buku ini menawarkan pandangan yang sangat segar tentang " metode statistik yang bertujuan untuk menjaga agar jumlah asumsi yang mendasari selemah mungkin ". Saya merasa kurang bertele-tele dengan buku pengantar / primer lainnya; ini bisa menjadi hal yang baik atau buruk tergantung pada preferensi seseorang. Satu-satunya "delta" yang dimiliki buku ini adalah ia tidak benar-benar membahas tes peringkat.


(+1) Tampaknya buku Wasserman "All of Statistics" juga berisi beberapa, meskipun lebih pendek, pengobatan statistik non-parametrik. Kedua buku itu, dan juga banyak buku lainnya, bagus, tetapi IMHO terlalu banyak bagi peneliti / ilmuwan terapan. Tentu, tidak ada salahnya untuk mengetahui semua teorema dan bukti, tapi itu "bagus untuk dimiliki" daripada "harus dimiliki", mengingat keterbatasan waktu dan ruang lingkup. Saya masih belum menemukan buku statistik yang seimbang untuk ilmuwan terapan (yaitu, cukup keras tanpa masuk ke rincian yang terlalu dalam serta berguna dari perspektif aplikasi).
Aleksandr Blekh
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.