Tidak diragukan Anda telah diberitahu sebaliknya, tetapi mean median tidak menyiratkan simetri.=
Ada ukuran skewness berdasarkan median minus rata-rata (skewness Pearson kedua), tetapi bisa 0 ketika distribusinya tidak simetris (seperti ukuran skewness umum lainnya).
Demikian pula, hubungan antara mean dan median tidak selalu menyiratkan hubungan yang sama antara midhinge ( ) dan median. Mereka dapat menyarankan kemiringan yang berlawanan, atau yang satu mungkin sama dengan median sedangkan yang lain tidak.( Q1+ Q3) / 2
Salah satu cara untuk menyelidiki simetri adalah melalui plot simetri *.
Jika adalah pengamatan terurut dari terkecil hingga terbesar (statistik urutan), dan adalah median, maka plot plot simetri vs , vs , ... dan seterusnya. M Y ( n ) - M M - Y ( 1 ) Y ( n - 1 ) - M M - Y ( 2 )Y( 1 ), Y( 2 ), . . . , Y( n )M.Y( n )- M.M.- Y( 1 )Y( n - 1 )- M.M.- Y( 2 )
* Minitab dapat melakukan itu . Memang saya meningkatkan plot ini sebagai kemungkinan karena saya telah melihat mereka dilakukan di Minitab.
Berikut ini empat contoh:
Plot simetri
(Distribusi sebenarnya adalah (kiri ke kanan, baris pertama lebih dulu) - Laplace, Gamma (bentuk = 0,8), beta (2,2) dan beta (5,2). Kodenya milik Ross Ihaka, dari sini )
Dengan contoh simetris berekor berat, sering kali titik paling ekstrem bisa sangat jauh dari garis; Anda akan kurang memperhatikan jarak dari garis satu atau dua poin saat Anda berada di dekat kanan atas gambar.
Tentu saja ada plot lain (saya sebutkan plot simetri bukan dari rasa advokasi tertentu, tetapi karena saya tahu itu sudah diterapkan di Minitab). Jadi mari kita jelajahi beberapa yang lain.
Berikut adalah skewplot terkait yang disarankan oleh Nick Cox dalam komentar:
Plot kemiringan
Dalam plot ini, tren naik akan menunjukkan ekor kanan yang biasanya lebih berat daripada kiri dan tren turun akan menunjukkan ekor kiri yang biasanya lebih berat daripada kanan, sementara simetri akan disarankan oleh plot yang relatif datar (walaupun mungkin cukup berisik).
Nick menyarankan bahwa plot ini lebih baik (khususnya "lebih langsung"). Saya cenderung setuju; interpretasi plot tampaknya sedikit lebih mudah, meskipun informasi dalam plot yang sesuai sering sangat mirip (setelah Anda mengurangi kemiringan unit pada set pertama, Anda mendapatkan sesuatu yang sangat mirip dengan set kedua).
[Tentu saja, tak satu pun dari hal-hal ini akan memberi tahu kita bahwa distribusi data yang diambil sebenarnya simetris; kami mendapatkan indikasi seberapa dekat-ke-simetris sampel, dan sejauh itu kita dapat menilai apakah data cukup konsisten dengan diambil dari populasi yang hampir simetris.]