Divergensi KL biasanya digunakan dalam pengaturan teoretis informasi, atau bahkan pengaturan Bayesian, untuk mengukur perubahan informasi antara distribusi sebelum dan sesudah menerapkan beberapa inferensi, misalnya. Ini bukan jarak dalam arti (metrik) yang khas, karena kurangnya kesimetrian dan segitiga, dan karena itu digunakan di tempat-tempat di mana arah itu bermakna.
Jarak KS biasanya digunakan dalam konteks tes non-parametrik. Bahkan, saya jarang melihatnya digunakan sebagai "jarak antara distribusi" generik, di mana jarak , jarak Jensen-Shannon, dan jarak lainnya lebih umum.ℓ1