Memiliki banyak latihan mengajar orang awam tentang standar deviasi dan varian.
TL; DR; Itu seperti jarak rata-rata dari rata-rata. (yang agak membingungkan dan menyesatkan dalam versi ringkas seperti itu. Jadi baca artikel lengkapnya)
Saya menganggap orang awam tahu tentang rata-rata. Saya memberi ceramah tentang Pentingnya mengetahui SD dan memperkirakan kesalahan (lihat PS di bawah). Lalu saya berjanji bahwa tidak ada matematika tinggi atau pengetahuan statistik suci yang akan digunakan - hanya alasan kering dan logika murni.
Masalah. Katakanlah kita memiliki termometer (saya memilih perangkat pengukuran tergantung pada apa yang lebih dekat dengan pendengaran).
Kami melakukan pengukuran N pada suhu dan termometer yang sama menunjukkan pada kami sesuatu seperti 36.5, 35.9, 37.0, 36.6, ... (lihat gambar). Kita tahu bahwa suhu sebenarnya sama, tetapi termometer terletak pada kita sedikit setiap pengukuran.
Bagaimana kita bisa memperkirakan seberapa banyak sampah kecil ini bagi kita?
Kita dapat menghitung rata-rata (lihat garis merah pada gambar di bawah). Bisakah kita mempercayainya? Bahkan setelah rata-rata, apakah sudah cukup presisi untuk kebutuhan kita?
Pendekatan termudah . Kita dapat mengambil titik terjauh, menghitung jarak antara itu dan rata-rata (garis merah) dan mengatakan, bahwa ini adalah bagaimana termometer terletak pada kita, karena itu adalah kesalahan maksimum yang kita lihat. Orang bisa menebak, itu bukan estimasi terbaik. Jika kita melihat gambar, sebagian besar poin berada di sekitar rata-rata, bagaimana kita dapat memutuskan hanya dengan satu poin? Sebenarnya orang dapat mempraktekkan alasan penomoran mengapa estimasi seperti itu kasar dan biasanya buruk.
Varians . Lalu ... ayo ambil semua jarak dan hitung jarak rata-rata !
BTW, bagaimana cara menghitung jarak? Ketika Anda mendengar "jarak" dalam bahasa Inggris (Spanyol? Denmark?) Artinya "kurangi" dalam matematika. Jadi kita mulai rumus kita dengan mana adalah rata-rata dan adalah salah satu pengukuran.ˉ x x i(xi−x¯)x¯xi
Maka orang bisa membayangkan bahwa rumus jarak rata-rata akan menjumlahkan segalanya dan membaginya dengan N:
∑(xi−x¯)N
Tapi ada masalah. Kita dapat dengan mudah melihat, misalnya. bahwa 36,4, dan 36,8 berada pada jarak yang sama dari 36,6. tetapi jika kita meletakkan nilai dalam rumus di atas, kita mendapatkan -0.2 dan +0.2, dan jumlah mereka sama dengan 0, yang bukan yang kita inginkan.
Bagaimana cara menyingkirkan tandanya? (Pada poin ini orang awam biasanya mengatakan "Ambil nilai absolut", dan dapatkan saran bahwa "mengambil nilai absolut sedikit buatan, apa cara lain?"). Kita bisa menguadratkan nilai! Maka formula menjadi:
∑(xi−x¯)2N
.
Formula ini disebut "Varians" dalam statistik. Dan sangat cocok untuk memperkirakan penyebaran nilai termometer kami (atau apa pun), daripada hanya mengambil jarak maksimum.
Simpangan baku . Tapi masih ada satu masalah lagi. Lihatlah rumus varians. Kotak membuat unit pengukuran kami ... kuadrat. Jika termometer mengukur suhu dalam ° C (atau ° F) maka estimasi kesalahan kami diukur dalam (atau ). Bagaimana cara menetralisir kotak? - Gunakan akar kuadrat!°C2°F2
∑(xi−x¯)2N−−−−−−−−−−√
Jadi di sini kita sampai pada rumus Standar Deviasi yang biasanya dilambangkan sebagai . Dan itu adalah cara yang lebih baik untuk memperkirakan presisi perangkat kami.σ
Pada titik ini seorang awam mengerti dengan cukup jelas, bagaimana kita sampai di sini dan bagaimana standar deviasi / varians bekerja. Dari titik ini saya biasanya pergi ke aturan 68-95-99,7, menjelaskan juga tentang pengambilan sampel dan populasi, standar kesalahan vs persyaratan standar deviasi Dll.
Pentingnya mengetahui contoh bicara SD:
Katakanlah Anda memiliki beberapa alat pengukur, yang berharga $ 10.000 . Dan itu memberi Anda jawabannya: 42. Apakah Anda pikir satu membayar $ 1.000.000 untuk 42? Aduh! Satu membayar 1.000.000 untuk ketepatan jawaban itu. Karena Nilai - tidak ada biaya tanpa mengetahui Kesalahannya. Anda membayar kesalahan, bukan nilainya. Ini adalah contoh kehidupan yang baik.
Dalam kehidupan bersama, sebagian besar waktu kita menggunakan penggaris untuk mengukur jarak. Penguasa memberi Anda presisi sekitar satu milimeter (jika Anda tidak berada di AS). Bagaimana jika Anda harus melampaui milimeter dan mengukur sesuatu dengan presisi 0.1mm? - Anda mungkin akan menggunakan caliper. Sekarang, mudah untuk memeriksa, bahwa penggaris termurah (tetapi masih dengan presisi milimeter) berharga sen, sementara kaliper yang bagus harganya sepersepuluh dolar. 2 besarnya harga untuk 1 besaran presisi. Dan itu sangat biasa dari berapa banyak Anda membayar kesalahan.