Anda harus melihat distribusi lognormal .
Orang-orang dapat menggunakan log karena mereka pikir itu menekan skala atau sesuatu, tetapi penggunaan utama log adalah bahwa Anda bekerja dengan data yang memiliki distribusi lognormal. Ini akan cenderung menjadi hal-hal seperti gaji, harga perumahan, dll, di mana semua nilai positif dan sebagian besar relatif sederhana, tetapi beberapa sangat besar.
Jika Anda dapat mengambil log data dan menjadi normal, maka Anda dapat memanfaatkan banyak fitur dari distribusi normal, seperti mean yang terdefinisi dengan baik, standar deviasi (dan karenanya skor-z), simetri, dll.
Demikian pula, penambahan log sama dengan perkalian nilai-nilai yang tidak dicatat. Yang berarti bahwa Anda telah mengubah distribusi di mana kesalahan adalah aditif menjadi salah satu di mana mereka adalah multiplikatif (yaitu berbasis persentase). Karena teknik seperti regresi OLS memerlukan distribusi kesalahan normal, bekerja dengan log memperluas penerapannya dari proses aditif ke multiplikasi.