Tampaknya ada sesuatu dalam pemahaman manusiawi kita yang menciptakan kesulitan dalam memahami secara intuitif gagasan varian. Dalam arti sempit, jawabannya langsung: mengkuadratkan kita dari pemahaman refleksif kita. Tapi, apakah itu hanya varian yang menghadirkan masalah, atau apakah itu seluruh gagasan penyebaran data? Kami berlindung di kisaran, atau hanya menyatakan minimum dan maksimum, tetapi apakah kita hanya menghindari kesulitan sebenarnya? Dalam mean (mode atau median) kita menemukan pusat, ringkasan ... penyederhanaan; varians menyebar hal-hal di sekitar dan membuat mereka tidak nyaman. Orang primitif pasti akan menggunakan nilai rata-rata dalam berburu binatang dengan melakukan triangulasi untuk berdoa, tetapi saya mengira jauh di kemudian hari kami merasa perlu untuk mengukur penyebaran berbagai hal. Bahkan, istilah varians pertama kali diperkenalkan oleh Ronald Fisher baru-baru ini pada tahun 1918 di kertas "Korelasi Antara Kerabat pada Dugaan Warisan Mendel."
Kebanyakan orang yang mengikuti berita akan mendengar kisah pidato malang Larry Summers tentang bakat matematika berdasarkan gender , yang mungkin terkait dengan kepergiannya dari Harvard. Singkatnya, ia menyarankan varian yang lebih luas dalam distribusi kompetensi matematika di antara laki-laki dibandingkan dengan perempuan, meskipun kedua jenis kelamin menikmati rata-rata yang sama. Terlepas dari kesesuaian atau implikasi politik, ini tampaknya dibuktikan dalam literatur ilmiah .
Lebih penting lagi, mungkin pemahaman tentang isu-isu seperti perubahan iklim - tolong maafkan saya karena mengemukakan topik yang dapat menyebabkan diskusi yang tidak layak - oleh populasi umum dapat dibantu oleh peningkatan keakraban dengan gagasan varians.
Masalah semakin bertambah ketika kami mencoba memahami kovarian, seperti yang ditunjukkan dalam posting ini , menampilkan jawaban yang hebat, dan penuh warna oleh @whuber di sini .
Mungkin tergoda untuk mengabaikan pertanyaan ini sebagai terlalu umum, tetapi jelas bahwa kita membahasnya secara tidak langsung, seperti dalam posting ini , di mana matematika itu sepele, namun konsepnya tetap sulit dipahami, percaya penerimaan yang lebih nyaman dari kisaran sebagai menentang varian ide yang lebih bernuansa .
Dalam sebuah surat dari Fisher untuk EBFord , merujuk pada kontroversi atas kecurigaannya pada eksperimen Mendel, kita membaca: "Sekarang, ketika data telah dipalsukan, saya tahu betul bagaimana umumnya orang meremehkan frekuensi penyimpangan kesempatan yang luas , sehingga Kecenderungan selalu membuat mereka terlalu setuju dengan harapan ... penyimpangan [dalam data Mendel] sangat kecil. " RA Fisher yang hebat sangat tertarik untuk mencurigai varian-varian kecil dalam sampel-sampel kecil sehingga dia menulis : "tetap ada kemungkinan, antara lain Mendel ditipu oleh beberapa asisten yang tahu betul apa yang diharapkan."
Dan sangat mungkin bahwa bias terhadap penyebaran yang menyangkal atau salah paham ini masih ada hingga hari ini. Jika demikian, adakah penjelasan mengapa kita lebih nyaman dengan konsep sentralitas daripada dengan dispersi? Adakah yang bisa kita lakukan untuk menginternalisasi ide itu?
Nassim Taleb telah meraup untung menerapkan persepsi (yah, benar-benar Benoit Mandelbrot ) tentang cacat pemahaman varians untuk mengeksploitasi masa krisis, dan telah mencoba membuat konsep tersebut dapat dipahami oleh massa dengan kalimat seperti, "varians variasinya adalah, secara epistemologis , ukuran kurangnya pengetahuan tentang kurangnya pengetahuan tentang "- ya, ada lebih banyak konteks untuk suap ini ... Dan untuk penghargaannya, ia juga membuatnya lebih sederhana dengan ide Turki Thanksgiving . Orang mungkin berpendapat bahwa kunci untuk berinvestasi adalah memahami varians (dan kovarians).
Jadi mengapa begitu licin, dan bagaimana cara memperbaikinya? Tanpa formula ... hanya intuisi bertahun-tahun berurusan dengan ketidakpastian ... Saya tidak tahu jawabannya, tapi itu tidak matematis (tentu saja itu): misalnya, saya bertanya-tanya apakah ide kurtosis mengganggu varians. Dalam plot berikut ini kami memiliki dua histogram yang tumpang tindih dengan varian yang hampir sama; namun, reaksi brengsek lutut saya adalah bahwa yang memiliki ekor paling panjang, dan puncak tertinggi (kurtosis lebih tinggi) lebih "menyebar":