Saya ingin tahu apakah ada uji statistik untuk "menguji" pentingnya distribusi bimodal. Maksud saya, seberapa banyak data saya memenuhi distribusi bimodal atau tidak? Jika demikian, apakah ada tes dalam program R?
Saya ingin tahu apakah ada uji statistik untuk "menguji" pentingnya distribusi bimodal. Maksud saya, seberapa banyak data saya memenuhi distribusi bimodal atau tidak? Jika demikian, apakah ada tes dalam program R?
Jawaban:
Pendekatan lain yang mungkin untuk masalah ini adalah untuk memikirkan apa yang mungkin terjadi di balik layar yang menghasilkan data yang Anda lihat. Artinya, Anda dapat berpikir dalam hal model campuran , misalnya, model campuran Gaussian. Misalnya, Anda mungkin percaya bahwa data Anda diambil dari satu populasi normal tunggal, atau dari campuran dua distribusi normal (dalam proporsi tertentu), dengan rerata dan varian yang berbeda. Tentu saja, Anda tidak harus percaya bahwa hanya ada satu atau dua, Anda juga tidak harus percaya bahwa populasi tempat pengambilan data harus normal.
Ada (setidaknya) dua paket R yang memungkinkan Anda memperkirakan model campuran. Satu paket adalah flexmix , dan yang lainnya adalah mclust . Setelah memperkirakan dua model kandidat, saya percaya dimungkinkan untuk melakukan tes rasio kemungkinan. Atau, Anda bisa menggunakan metode cross-fitting bootstrap parametrik ( pdf ).
Seperti disebutkan dalam komentar, halaman Wikipedia tentang 'distribusi Bimodal' mencantumkan delapan tes multimodalitas terhadap unimodalitas dan memasok referensi untuk tujuh diantaranya.
Setidaknya ada beberapa di R. Misalnya:
Paket tersebut diptest
mengimplementasikan uji celup Hartigan.
The stamp
data dalam bootstrap
paket digunakan dalam Efron dan Tibshirani ini Pengantar Bootstrap (buku yang paket didasarkan) untuk melakukan contoh yang berkaitan dengan bootstrap pada jumlah mode; jika Anda memiliki akses ke buku Anda mungkin dapat menggunakan pendekatan itu.
Efron, B. dan Tibshirani, R. (1993) Pengantar Bootstrap .
Chapman dan Hall, New York, London.
-
Ada pertanyaan pada CV yang berbicara tentang mengidentifikasi (yaitu, memperkirakan dan bukannya menguji) jumlah mode yang muncul pada pencarian @ whuber. Ada baiknya membaca jawaban di sana. Salah satu respons di sana (milik saya, saat itu terjadi) memiliki tautan ke pencarian Google yang menghasilkan makalah ini oleh David Donoho tentang pembuatan CI satu sisi untuk sejumlah mode, yang tentu saja dapat digunakan sebagai tes (mis. , jika interval satu sisi tidak termasuk case unimodal, Anda dapat menolak unimodality). Sejauh yang saya tahu tidaksalah satu tes yang disebutkan oleh Wikipedia. Saya tidak berpikir ada implementasi R dari interval itu, tetapi (terlepas dari kenyataan bahwa Donoho cenderung menggunakan alat yang cukup canggih dalam pembahasannya) itu sebenarnya ide yang cukup sederhana untuk diterapkan. Ide itu secara langsung terkait dengan gagasan menggunakan estimasi kepadatan kernel.