Pertama komentar umum pada mode:
Anda tidak boleh menggunakan pendekatan itu untuk mendapatkan mode (setidaknya secara nosional) data yang didistribusikan terus menerus; Anda tidak mungkin memiliki nilai berulang (kecuali jika Anda memiliki sampel yang sangat besar itu akan menjadi keajaiban kecil, dan bahkan kemudian berbagai masalah numerik dapat membuatnya berperilaku dengan cara yang agak tak terduga), dan umumnya Anda hanya akan mendapatkan nilai minimum yang cara. Ini akan menjadi salah satu cara untuk menemukan salah satu mode global dalam data diskrit atau kategorikal, tetapi saya mungkin tidak akan melakukannya dengan cara itu. Berikut adalah beberapa pendekatan lain untuk mendapatkan mode data diskrit atau kategorikal:
x = rpois(30,12.3)
tail(sort(table(x)),1) #1: category and count; if multimodal this only gives one
w=table(x); w[max(w)==w] #2: category and count; this can find more than one mode
which.max(table(x)) #3: category and *position in table*; only finds one mode
Jika Anda hanya menginginkan nilai dan bukan hitungan atau posisi, names()
akan mendapatkannya dari itu
Untuk mengidentifikasi mode (mungkin ada lebih dari satu mode lokal) untuk data kontinu dalam mode dasar, Anda bisa menampar data (seperti dengan histogram) atau Anda dapat memuluskannya (menggunakan density
misalnya) dan mencoba menemukan satu atau lebih mode seperti itu.
Jumlah histogram yang lebih sedikit akan membuat estimasi mode Anda lebih sedikit noise, tetapi lokasi tidak akan disematkan menjadi lebih baik daripada lebar bin (yaitu Anda hanya mendapatkan interval). Lebih banyak tempat sampah memungkinkan lebih banyak presisi dalam sebuah tempat sampah, tetapi suara dapat membuatnya melompati banyak tempat sampah seperti itu; perubahan kecil dalam asal-usul atau lebar nampan dapat menghasilkan perubahan mode yang relatif besar. (Ada tradeoff varians yang sama di seluruh statistik.)
Catatan yang summary
akan memberi Anda beberapa statistik dasar.
[Anda harus menggunakan sd(x)
daripada sqrt(var(x))
; lebih jelas untuk satu hal]
-
Sehubungan dengan q.2 ya; Anda tentu bisa menunjukkan rata-rata dan median data pada tampilan seperti histogram atau plot kotak. Lihat di sini untuk beberapa contoh dan kode yang harus dapat digeneralisasi untuk kasus apa pun yang Anda butuhkan.