Apakah ada tes statistik yang parametrik dan non-parametrik? Pertanyaan ini ditanyakan oleh panel wawancara. Apakah ini pertanyaan yang valid?
Apakah ada tes statistik yang parametrik dan non-parametrik? Pertanyaan ini ditanyakan oleh panel wawancara. Apakah ini pertanyaan yang valid?
Jawaban:
Pada dasarnya sulit untuk mengatakan dengan tepat apa yang dimaksud dengan "tes parametrik" dan "tes non-parametrik", meskipun ada banyak contoh konkret di mana sebagian besar akan setuju pada apakah tes itu parametrik atau non-parametrik (tetapi tidak pernah keduanya) . Pencarian cepat memberikan tabel ini , yang saya bayangkan mewakili perbedaan praktis yang umum di beberapa bidang antara tes parametrik dan non-parametrik.
Tepat di atas tabel yang dimaksud ada komentar:
"... data parametrik memiliki distribusi normal yang mendasarinya .... Yang lainnya adalah non-parametrik."
Ini mungkin merupakan kriteria yang diterima di beberapa area bahwa kita menganggap normal dan menggunakan ANOVA, dan ini parametrik, atau kita tidak menganggap normalitas dan menggunakan alternatif non-parametrik.
Ini mungkin bukan definisi yang sangat baik, dan menurut saya itu tidak benar, tetapi mungkin praktis. Sebagian besar karena tujuan akhir dalam ilmu sosial, katakanlah, adalah untuk menganalisis data, dan apa gunanya untuk dapat merumuskan model parametrik berdasarkan distribusi yang tidak normal dan kemudian tidak dapat menganalisis data?
Definisi alternatif, adalah mendefinisikan "tes non-parametrik" sebagai tes yang tidak mengandalkan asumsi distribusi dan tes parametrik seperti yang lainnya.
Definisi pertama dan juga definisi terakhir yang disajikan mendefinisikan satu kelas tes dan kemudian mendefinisikan kelas lainnya sebagai pelengkap (apa pun). Menurut definisi, ini mengesampingkan bahwa tes dapat parametrik maupun non-parametrik.
Yang benar adalah bahwa definisi yang terakhir juga bermasalah. Bagaimana jika ada asumsi "non-parametrik" alami tertentu, seperti simetri, yang dapat dikenakan? Apakah itu akan mengubah statistik uji yang sebaliknya tidak bergantung pada asumsi distribusi apa pun menjadi uji parametrik? Sebagian besar akan mengatakan tidak!
Oleh karena itu ada tes di kelas tes non-parametrik yang diizinkan untuk membuat beberapa asumsi distribusi selama mereka tidak "terlalu parametrik". Batas antara tes "parametrik" dan "non-parametrik" telah menjadi kabur, tetapi saya percaya bahwa sebagian besar akan menjunjung tinggi bahwa salah satu tes adalah parametrik atau non-parametrik, mungkin bisa juga mengatakan bahwa keduanya tidak masuk akal.
Mengambil sudut pandang yang berbeda, banyak tes parametrik adalah (setara dengan) tes rasio kemungkinan. Ini memungkinkan teori umum, dan kami memiliki pemahaman terpadu tentang sifat distribusi tes rasio kemungkinan pada kondisi keteraturan yang sesuai. Tes non-parametrik yang, sebaliknya, tidak setara dengan tes rasio kemungkinan per se tidak ada kemungkinan dan tanpa metodologi pemersatu berdasarkan kemungkinan kita harus hasil distribusi Turunkan berdasarkan kasus per kasus. Teori kemungkinan empiris- hlmdikembangkan terutama oleh Art Owen di Stanford, bagaimanapun, kompromi yang sangat menarik. Ini menawarkan pendekatan berbasis kemungkinan untuk statistik (poin penting bagi saya, karena saya menganggap kemungkinan sebagai objek yang lebih penting daripada nilai , katakanlah) tanpa perlu asumsi distribusi parametrik yang khas. Gagasan mendasar adalah penggunaan cerdik dari distribusi multinomial pada data empiris, metodenya sangat "parametrik" namun valid tanpa membatasi asumsi parametrik.
Tes berdasarkan pada kemungkinan empiris, IMHO, nilai-nilai tes parametrik dan generalisasi tes non-parametrik, maka di antara tes yang dapat saya pikirkan, mereka mendekati kualifikasi untuk menjadi parametrik dan non-parametrik, meskipun saya ingin tidak menggunakan terminologi ini.
Parametrik digunakan dalam (setidaknya) dua arti: A - Untuk menyatakan Anda mengasumsikan keluarga dari distribusi kebisingan hingga parameter itu. B - Untuk menyatakan Anda mengasumsikan hubungan fungsional spesifik antara variabel penjelas dan hasil.
Beberapa contoh:
Istilah "semi-parametrik" biasanya merujuk pada kasus B dan berarti Anda tidak mengasumsikan keseluruhan hubungan fungsional, tetapi Anda memiliki asumsi yang lebih ringan seperti "aditif dalam beberapa transformasi yang mulus dari prediktor".
Anda juga dapat memiliki asumsi yang lebih ringan pada distribusi suara - seperti "semua momen terbatas", tanpa secara spesifik menentukan bentuk distribusi. Sepengetahuan saya, tidak ada istilah untuk jenis asumsi ini.
Perhatikan bahwa jawabannya berkaitan dengan asumsi yang mendasari di balik proses menghasilkan data. Ketika mengatakan "a-parametric test", yang biasanya mengacu pada non-parametrik dalam arti A. Dalam hal ini yang Anda maksudkan, maka saya akan menjawab "tidak". Tidak mungkin menjadi parametrik dan non-parametrik dalam arti yang sama pada saat yang sama.
Saya kira itu tergantung pada apa yang mereka maksud dengan "parametrik dan non-parametrik"? Pada saat yang sama persis keduanya, atau perpaduan keduanya?
Banyak yang menganggap model bahaya proporsional Cox sebagai semi-parametrik, karena tidak memperkirakan bahaya baseline secara parametrik.
Atau Anda dapat memilih untuk melihat banyak statistik non-parametrik sebagai parametrik besar-besaran.
Bradley, dalam Uji Statistik Distribusi Bebas Gratis (1968, hlm. 15-16) - lihat pertanyaan ini untuk kutipan) mengklarifikasi perbedaan antara tes bebas-distribusi dan nonparametrik , yang katanya sering disatukan satu sama lain, dan memberikan contoh uji distribusi bebas parametrik sebagai tes Masuk untuk median. Tes ini tidak membuat asumsi tentang distribusi yang mendasari populasi sampel dari nilai variate, sehingga bebas distribusi . Namun, jika median yang dipilih benar, nilai-nilai di atas dan di bawahnya harus dipilih pada probabilitas yang sama, menguji sampel acak dari
Memperbarui