Statistik Kappa ( ) diperkenalkan pada tahun 1960 oleh Cohen [1] untuk mengukur kesepakatan antara dua penilai. Perbedaannya, bagaimanapun, telah menjadi sumber kontradiksi untuk beberapa waktu.
Pertanyaan saya adalah tentang perhitungan varians mana yang terbaik untuk digunakan dengan sampel besar. Saya cenderung percaya bahwa yang diuji dan diverifikasi oleh Fleiss [2] akan menjadi pilihan yang tepat, tetapi ini tampaknya bukan satu-satunya yang diterbitkan yang tampaknya benar (dan digunakan di seluruh literatur yang cukup baru).
Saat ini saya memiliki dua cara konkret untuk menghitung varians sampel besar asimptotiknya:
- Metode yang diperbaiki diterbitkan oleh Fleiss, Cohen dan Everitt [2];
- Metode delta yang dapat ditemukan dalam buku oleh Colgaton, 2009 [4] (halaman 106).
Untuk mengilustrasikan beberapa kebingungan ini, berikut adalah kutipan oleh Fleiss, Cohen dan Everitt [2], penekanan pada saya:
Banyak usaha manusia telah dikutuk dengan kegagalan berulang sebelum keberhasilan akhir dicapai. Penskalaan Gunung Everest adalah salah satu contohnya. Penemuan Northwest Passage adalah yang kedua. Derivasi dari kesalahan standar yang benar untuk kappa adalah yang ketiga .
Jadi, inilah ringkasan kecil dari apa yang terjadi:
- 1960: Cohen menerbitkan makalahnya "Koefisien kesepakatan untuk skala nominal" [1] memperkenalkan ukuran kesepakatan yang diperbaiki secara kebetulan antara dua penilai yang disebut . Namun, ia menerbitkan formula yang salah untuk perhitungan varians.
- 1968: Everitt mencoba untuk memperbaikinya, tetapi formulanya juga salah.
- 1969: Fleiss, Cohen dan Everitt menerbitkan formula yang benar di koran "Contoh Besar Kesalahan Standar Kappa dan Weighted Kappa" [2]
- 1971: Fleiss menerbitkan statistik lain (tetapi yang berbeda) dengan nama yang sama, dengan formula yang salah untuk varians.
- 1979: Fleiss Nee dan Landis menerbitkan formula yang diperbaiki untuk Fleiss ' .
Pada awalnya, perhatikan notasi berikut. Notasi ini menyiratkan operator penjumlahan harus diterapkan ke semua elemen dalam dimensi di mana titik ditempatkan:
Sekarang, seseorang dapat menghitung Kappa sebagai:
Di mana
adalah perjanjian yang diamati, dan
adalah perjanjian kebetulan.
Sejauh ini, perhitungan varian yang benar untuk Cohen diberikan oleh:
dan di bawah hipotesis nol itu diberikan oleh:
Metode Congalton tampaknya didasarkan pada metode delta untuk mendapatkan varian (Agresti, 1990; Agresti, 2002); Namun saya tidak yakin apa metode delta itu atau mengapa itu harus digunakan. The varians, dengan metode ini, diberikan oleh:
di mana
(Congalton menggunakan subskrip daripada , Tetapi tampaknya berarti hal yang sama. Selain itu, saya mengandaikan bahwa harus menjadi matriks penghitungan, yaitu matriks kebingungan sebelum dibagi dengan jumlah sampel sebagai terkait dengan rumus )
Bagian aneh lainnya adalah bahwa buku Colgaton tampaknya merujuk pada makalah asli oleh Cohen, tetapi tampaknya tidak mengutip koreksi terhadap varian Kappa yang diterbitkan oleh Fleiss et al, tidak sampai ia melanjutkan untuk membahas Kappa tertimbang. Mungkin publikasi pertamanya ditulis ketika formula asli untuk kappa masih hilang dalam kebingungan?
Apakah ada yang bisa menjelaskan mengapa perbedaan itu? Atau mengapa seseorang menggunakan varians metode delta alih-alih versi yang diperbaiki oleh Fleiss?
[1]: Fleiss, Joseph L.; Cohen, Yakub; Everitt, BS; Sampel besar kesalahan standar kappa dan kappa tertimbang. Buletin Psikologis, Vol 72 (5), November 1969, 323-327. doi: 10.1037 / h0028106
[2]: Cohen, Jacob (1960). Koefisien kesepakatan untuk skala nominal. Pengukuran Pendidikan dan Psikologis 20 (1): 37–46. DOI: 10.1177 / 001316446002000104.
[3]: Alan Agresti, Analisis Data Kategorikal, edisi ke-2. John Wiley and Sons, 2002.
[4]: Russell G. Congalton dan Green, K .; Menilai Keakuratan Data Sensed Remote: Prinsip dan Praktek, edisi ke-2. 2009