Bagaimana saya mengevaluasi standar deviasi?


15

Saya telah mengumpulkan tanggapan dari 85 orang tentang kemampuan mereka untuk melakukan tugas-tugas tertentu.

Responsnya ada pada skala Likert lima poin:

5 = Sangat Bagus, 4 = Bagus, 3 = Rata-rata, 2 = Buruk, 1 = Sangat Buruk,

Nilai rata-rata adalah 2,8 dan standar deviasi adalah 0,54.

Saya mengerti apa arti dan standar deviasi.

Pertanyaan saya adalah: seberapa baik (atau buruk) standar deviasi ini?

Dengan kata lain, apakah ada pedoman yang dapat membantu dalam evaluasi standar deviasi.


Apa artinya bagi SD untuk menjadi baik atau buruk di sini?
gung - Reinstate Monica

7
Memang agak sulit untuk mendapatkan seperti SD kecil dengan data seperti ini: selama rata-rata 2,8, SD harus setidaknya . (Bahkan jika 2,8 mewakili nilai bulat, SD masih harus melebihi 0,357.) SD 0,54 menyiratkan bahwa tidak lebih dari dua orang dapat menjawab dengan 5 (dengan 21 2 dan 62 3) dan tidak lebih dari enam bisa menjawab dengan 1 (dengan 5 2 dan 74 3). Ini menunjukkan bahwa pertanyaan tersebut dapat memberikan informasi yang sangat sedikit karena skala tidak secara efektif mendiskriminasi. 0,2×0.8=0,4
whuber

@whuber data forsensik luar biasa! Tetapi saya juga bisa membayangkan bahwa ia rata-rata menjawab pertanyaan yang berbeda atau melakukan sesuatu yang salah dalam perhitungannya. Tampaknya sulit membayangkan bahwa orang benar-benar merespons dengan seragam, terutama ketika berbicara tentang kemampuan yang seharusnya mereka miliki.
Erik

Jawaban:


17

Penyimpangan standar tidak "baik" atau "buruk". Mereka adalah indikator bagaimana menyebar data Anda. Terkadang, dalam skala peringkat, kami ingin spread luas karena ini menunjukkan bahwa pertanyaan / peringkat kami mencakup rentang grup yang kami beri peringkat. Di lain waktu, kami ingin sd kecil karena kami ingin semua orang menjadi "tinggi".

3+2

Begitu. Apa tujuan dari tes Anda? Siapa yang ada dalam sampel?


2
(+1) Hanya untuk menambahkan sedikit pada komentar "Penyimpangan standar tidak 'baik' atau 'buruk'" - memiliki prediktor dengan deviasi standar besar bisa "baik" karena, dalam regresi, berbanding terbalik dengan standar. kesalahan estimasi koefisien regresi. Di sisi lain, jika Anda khawatir dengan ketepatan pengukuran, maka standar deviasi yang besar adalah "buruk". Saya menduga minat poster asli lebih dekat dengan yang pertama tetapi tidak jelas.
Makro

10

Jawaban singkatnya, tidak masalah dan sedikit lebih rendah dari yang saya harapkan dari data survei. Tapi mungkin kisah bisnis Anda lebih di rata-rata atau persen di atas-kotak-2.

Untuk skala diskrit dari penelitian ilmu sosial, dalam praktiknya deviasi standar adalah fungsi langsung dari rata-rata. Secara khusus, saya telah menemukan melalui analisis empiris dari banyak studi seperti itu bahwa standar deviasi aktual dalam survei pada skala 5 poin adalah 40% -60% dari variasi maksimum yang mungkin (sayangnya tidak didokumentasikan di sini).

Pada tingkat yang paling sederhana, pertimbangkan yang ekstrem, bayangkan rata-rata adalah 5,0. Deviasi standar harus nol, karena satu-satunya cara untuk rata-rata 5 adalah untuk semua orang menjawab 5. Sebaliknya, jika rata-rata adalah 1.0 maka kesalahan standar harus 0 juga. Jadi deviasi standar didefinisikan dengan tepat mengingat rerata.

Sekarang di antara ada lebih banyak daerah abu-abu. Bayangkan bahwa orang bisa menjawab 5.0 atau 1.0 tetapi tidak ada di antaranya. Kemudian deviasi standar adalah fungsi tepat dari mean:

stdev = sqrt ((5-mean) * (mean-1))

Simpangan baku maksimum untuk jawaban pada skala terikat apa pun adalah setengah dari lebar skala. Ini sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2.

Sekarang tentu saja orang dapat menjawab nilai di antaranya. Dari metastudies data survei di perusahaan kami, saya menemukan bahwa standar deviasi untuk skala numerik dalam praktiknya adalah 40% -60% dari maksimum. Secara khusus

  • 40% untuk skala poin 100%,
  • 50% untuk skala 10 poin dan
  • 60% untuk skala 5 poin dan
  • 100% untuk skala biner

Jadi untuk dataset Anda, saya mengharapkan deviasi standar 60% x 2.0 = 1.2. Anda mendapat 0,54, yaitu sekitar setengah dari apa yang saya harapkan jika hasilnya adalah peringkat yang dijelaskan sendiri. Apakah keterampilan menilai hasil tes baterai yang lebih rumit yang rata-rata dan karenanya akan memiliki varian yang lebih rendah?

Namun, kisah sebenarnya mungkin kemampuannya sangat rendah atau relatif tinggi dibandingkan dengan tugas-tugas lain. Laporkan persentase rata-rata atau 2-kotak teratas antara keterampilan dan fokuskan analisis Anda pada hal itu.


-1

Jika data terdistribusi secara normal, Anda dapat melihat bagaimana populasi berada.

  • 68% dari semua orang berada dalam 1 standar deviasi dari mean ( 2.26 - 3.34):

masukkan deskripsi gambar di sini

  • 95% dari semua orang berada dalam 2 standar deviasi dari mean ( 1.72 - 3.88):

masukkan deskripsi gambar di sini

Ini memberi tahu Anda bagaimana "menyebar" nomor Anda.


1
Jawaban ini belum dibatalkan karena salah: ia menggunakan perkiraan praktis (seolah-olah itu tepat) dalam kasus di mana itu tidak berlaku. Jawabannya akan benar jika digantikan oleh kesimpulan Chebyshev's Ketimpangan (yang menyatakan bahwa setidaknya 75% dari pengamatan terletak di dalam dua SD dari pengamatan rata-rata; yaitu, setidaknya 75% dari tanggapan adalah 2 atau 3), tetapi ini tidak akan memberikan banyak wawasan.
whuber

Plus, itu hanya berlaku untuk populasi yang benar-benar berdistribusi normal. Dari sana, Anda dapat menghitung angka-angka secara sewenang-wenang persis dengan mengevaluasi integral atas pdf normal dengan batas-batas yang diberikan oleh sd di sekitar rata-rata. Benar-benar tidak membantu di sini.
Douba
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.