Misalkan kita memiliki variabel acak yang mengambil nilai non-numerik a, b, c dan ingin menghitung bagaimana distribusi empiris dari sampel variabel ini menyimpang dari distribusi yang sebenarnya. Ketidaksetaraan berikut (dari Cover & Thomas ) berlaku dalam kasus ini.
Teorema 12.4.1 (Teorema Sanov): Misalkan menjadi iid ∼ Q ( x ) . Biarkan E ⊆ P menjadi seperangkat distribusi probabilitas. Kemudian Q n ( E ) = Q n ( E ∩ P n ) ≤ ( n + 1 ) | X | 2 - n D ( P ∗ |
Ketidaksetaraan ini cukup longgar untuk kecil . Untuk hasil biner, , dan batas Chernoff-Hoeffding jauh lebih ketat.
Apakah ada batasan ketat yang sama untuk ?