Amar Sagoo memiliki artikel yang sangat bagus untuk menjelaskan hal ini: [ http://blog.amarsagoo.info/2007/09/making-sense-of-standard-deviation.html]
Untuk menambahkan upaya saya sendiri pada pemahaman intuitif:
Penyimpangan rata-rata adalah cara yang layak untuk menanyakan seberapa jauh titik "rata-rata" hipotetis dari rata-rata, tetapi itu tidak benar-benar berfungsi untuk menanyakan seberapa jauh semua titik dari satu sama lain, atau seberapa "menyebar" data tersebut.
Deviasi standar menanyakan seberapa jauh jarak semua poin tersebut, sehingga dalam memasukkan informasi yang lebih bermanfaat daripada hanya deviasi rata-rata (itulah sebabnya deviasi rata-rata biasanya hanya digunakan sebagai batu loncatan menuju pemahaman deviasi standar).
Analogi yang baik adalah Teorema Pythagoras. Teorema Pythagoras memberitahu kita jarak antara titik dalam dua dimensi dengan mengambil jarak horizontal dan jarak vertikal, mengkuadratkan mereka, menambahkan kuadrat, dan mengambil akar kuadrat dari total.
Jika Anda perhatikan dengan seksama, rumus untuk (populasi) Standar Deviasi pada dasarnya sama dengan Teorema Pythagoras, tetapi dengan lebih dari dua dimensi (dan menggunakan jarak dari setiap titik ke rata-rata sebagai jarak di setiap dimensi). Karena itu memberikan gambaran paling akurat tentang "jarak" antara semua titik dalam set data Anda.
Untuk mendorong analogi itu sedikit lebih jauh, deviasi absolut rata-rata akan seperti mengambil rata-rata jarak horizontal dan vertikal, yang lebih pendek dari total jarak, sedangkan jumlah deviasi absolut akan menambahkan jarak horizontal dan vertikal, yang lebih lama dari jarak yang sebenarnya.