Kapan kemiringan adalah hal yang buruk untuk dimiliki? Distribusi simetris (umumnya tetapi tidak selalu: misalnya, tidak untuk distribusi Cauchy) memiliki median, mode dan rata-rata yang sangat dekat satu sama lain. Jadi pertimbangkan, jika kita ingin mengukur lokasi suatu populasi, akan berguna untuk memiliki median, mode dan rata-rata yang dekat satu sama lain.
Sebagai contoh, jika kita mengambil logaritma distribusi pendapatan , kita mengurangi kecenderungan yang cukup sehingga kita bisa mendapatkan model lokasi pendapatan yang berguna. Namun, kita masih akan memiliki ekor kanan yang lebih berat dari yang kita inginkan. Untuk mengurangi itu lebih lanjut, kita mungkin menggunakan distribusi Pareto . Distribusi Pareto mirip dengan transformasi log-log dari data. Sekarang distribusi Pareto dan log-normal mengalami kesulitan pada skala pendapatan rendah. Misalnya, keduanya menderitadalam0 = - ∞. Perawatan masalah ini tercakup dalam transformasi daya .
Contoh dari 25 pendapatan dalam kilo dolar yang diambil dari www.
k$ lnk$
28 3.33220451
29 3.36729583
35 3.555348061
42 3.737669618
42 3.737669618
44 3.784189634
50 3.912023005
52 3.951243719
54 3.988984047
56 4.025351691
59 4.077537444
78 4.356708827
84 4.430816799
90 4.49980967
95 4.553876892
101 4.615120517
108 4.682131227
116 4.753590191
121 4.795790546
122 4.804021045
133 4.890349128
150 5.010635294
158 5.062595033
167 5.117993812
235 5.459585514
Kemiringan kolom pertama adalah 0,99, dan yang kedua adalah -0,05. Kolom pertama kemungkinan tidak normal (Shapiro-Wilk p = 0,04) dan yang kedua tidak signifikan tidak normal (p = 0,57).
First column Mean 90.0 (95% CI, 68.6 to 111.3) Median 84.0 (95.7% CI, 52.0 to 116.0)
Second col Exp(Mean) 76.7 (95% CI, 60.2 to 97.7) Exp(Median) 84.0 (95.7% CI, 52.0 to 116.0)
Jadi, pertanyaannya adalah, jika Anda adalah orang acak yang memiliki salah satu penghasilan yang terdaftar, apa yang akan Anda hasilkan? Apakah masuk akal untuk menyimpulkan bahwa Anda akan mendapatkan 90rb atau lebih dari rata-rata 84rb? Atau lebih mungkin untuk menyimpulkan bahwa bahkan median bias sebagai ukuran lokasi dan bahwaexp[ berarti ln( k $ ) ] 76,7 k, yang kurang dari median, juga lebih masuk akal sebagai perkiraan?
Jelas, log-normal di sini adalah model yang lebih baik dan rata-rata logaritma memberi kita ukuran lokasi yang lebih baik. Bahwa ini diketahui, jika tidak sepenuhnya dipahami, diilustrasikan oleh frasa "Saya mengantisipasi mendapat gaji 5 angka."