pi∑pai[ln(1/pi)]b
a=0,b=0
a=2,b=01−∑p2i1/∑p2ik1/k∑p2i=k(1/k)2=1/kk
a=1,b=1Hexp(H)kH=∑k(1/k)ln[1/(1/k)]=lnkexp(H)=exp(lnk)k
Formulasi ini ditemukan di IJ Good. 1953. Frekuensi populasi spesies dan estimasi parameter populasi. Biometrika 40: 237-264.
www.jstor.org/stable/2333344 .
Basis lain untuk logaritma (mis. 10 atau 2) sama-sama mungkin sesuai dengan selera atau preseden atau kenyamanan, dengan hanya variasi sederhana yang tersirat untuk beberapa formula di atas.
Penemuan kembali yang independen (atau reinvention) dari langkah kedua bermacam-macam di beberapa disiplin ilmu dan nama-nama di atas jauh dari daftar lengkap.
Mengikat langkah-langkah umum dalam keluarga tidak hanya menarik secara matematis. Ini menggarisbawahi bahwa ada pilihan ukuran tergantung pada bobot relatif yang diterapkan pada barang langka dan umum, dan dengan demikian mengurangi kesan adhockery yang dibuat oleh sejumlah kecil proposal yang tampaknya sewenang-wenang. Literatur di beberapa bidang dilemahkan oleh kertas dan bahkan buku-buku berdasarkan klaim lemah bahwa beberapa ukuran disukai oleh penulis (s) adalah ukuran terbaik yang harus digunakan semua orang.
Perhitungan saya menunjukkan bahwa contoh A dan B tidak begitu berbeda kecuali pada ukuran pertama:
----------------------------------------------------------------------
| Shannon H exp(H) Simpson 1/Simpson #items
----------+-----------------------------------------------------------
A | 0.656 1.927 0.643 1.556 14
B | 0.684 1.981 0.630 1.588 9
----------------------------------------------------------------------
(Beberapa orang mungkin tertarik untuk mencatat bahwa Simpson yang dinamai di sini (Edward Hugh Simpson, 1922-) sama dengan yang dihormati dengan nama Simpson's paradox. Ia melakukan pekerjaan yang sangat baik, tetapi ia bukan yang pertama kali menemukan kedua hal yang karenanya dia dinamai, yang pada gilirannya adalah paradoks Stigler, yang pada gilirannya ....)