Saya memiliki masalah yang mirip dengan pertanyaan yang diajukan di sini:
Bagaimana cara mengukur ketidakseragaman suatu distribusi?
Saya memiliki satu set distribusi probabilitas selama beberapa hari dalam seminggu. Saya ingin mengukur seberapa dekat masing-masing distribusi dengan (1 / 7,1 / 7, ..., 1/7).
Saat ini saya menggunakan jawaban dari pertanyaan di atas; sebuah L2-Norm, yang memiliki nilai 1 ketika distribusi memiliki massa 1 untuk satu hari, dan diminimalkan untuk (1 / 7,1 / 7, ..., 1/7). Saya skala linear ini sehingga terletak antara 0 dan 1, kemudian membalik sehingga 0 berarti tidak seragam dan 1 berarti seragam sempurna.
Ini bekerja cukup baik, tetapi saya punya satu masalah dengan itu; itu memperlakukan setiap hari kerja secara sama sebagai dimensi dalam ruang 7-Dim, sehingga tidak memperhitungkan kedekatan hari; dengan kata lain, memberikan skor yang sama dengan (1 / 2,1 / 2,0,0,0,0,0) dan (1 / 2,0,0,1 / 2,0,0,0) bahkan meskipun dalam beberapa hal yang terakhir lebih "menyebar" dan seragam, dan idealnya harus mendapatkan skor yang lebih tinggi. Jelas ada kerumitan tambahan bahwa urutan hari adalah lingkaran.
Bagaimana saya bisa mengubah heuristik ini untuk memperhitungkan hampir hari?