Ini telah disebut " logaritma mulai " oleh beberapa ( misalnya , John Tukey). (Untuk beberapa contoh, Google john tukey "memulai log" .)
Tidak apa-apa untuk digunakan. Bahkan, Anda bisa berharap harus menggunakan nilai awal bukan nol untuk menjelaskan pembulatan variabel dependen. Sebagai contoh, pembulatan variabel dependen ke bilangan bulat terdekat efektif memotong 1/12 dari varians sebenarnya, menunjukkan nilai awal yang masuk akal harus setidaknya 1/12. (Nilai itu tidak melakukan pekerjaan yang buruk dengan data ini. Menggunakan nilai-nilai lain di atas 1 tidak benar-benar mengubah banyak gambar; itu hanya meningkatkan semua nilai di plot kanan bawah hampir seragam.)
Ada alasan yang lebih dalam untuk menggunakan logaritma (atau log awal) untuk menilai varians: misalnya, kemiringan plot varians terhadap nilai estimasi pada skala log-log memperkirakan parameter Box-Cox untuk menstabilkan varians . Kekuatan-hukum cocok seperti varian untuk beberapa variabel terkait sering diamati. (Ini adalah pernyataan empiris, bukan teoretis.)
Jika tujuan Anda adalah untuk menyajikan varians, lanjutkan dengan hati-hati. Banyak audiens (selain dari yang ilmiah) tidak dapat memahami logaritma, apalagi yang mulai. Menggunakan nilai awal 1 setidaknya memiliki manfaat menjadi sedikit lebih mudah untuk dijelaskan dan ditafsirkan daripada beberapa nilai awal lainnya. Sesuatu yang perlu dipertimbangkan adalah untuk merencanakan akarnya, yang merupakan standar deviasi, tentu saja. Akan terlihat seperti ini:
Terlepas dari itu, jika tujuan Anda adalah untuk mengeksplorasi data, untuk belajar dari mereka, untuk menyesuaikan model, atau untuk mengevaluasi model, maka jangan biarkan apa pun menghalangi penemuan grafis yang wajar dari data Anda dan nilai-nilai yang diturunkan dari data. seperti varians ini.