Eksperimen deteksi sinyal biasanya menghadirkan pengamat (atau sistem diagnostik) dengan sinyal atau non-sinyal, dan pengamat diminta untuk melaporkan apakah menurut mereka item yang disajikan adalah sinyal atau non-sinyal. Eksperimen tersebut menghasilkan data yang mengisi matriks 2x2:
Teori pendeteksian sinyal mewakili data seperti mewakili skenario di mana keputusan "sinyal / non-sinyal" didasarkan pada kontinum sinyal yang di mana uji sinyal umumnya memiliki nilai lebih tinggi daripada uji coba non-sinyal, dan pengamat hanya memilih nilai kriteria di mana mereka akan melaporkan "sinyal":
Dalam diagram di atas, distribusi hijau dan merah mewakili distribusi "sinyal" dan "non-sinyal", dan garis abu-abu mewakili kriteria yang dipilih pengamat yang diberikan. Di sebelah kanan garis abu-abu, area di bawah kurva hijau mewakili hit dan area di bawah kurva merah mewakili alarm palsu; di sebelah kiri garis abu-abu, area di bawah kurva hijau mewakili kesalahan dan area di bawah kurva merah menunjukkan penolakan yang benar.
Seperti yang dapat dibayangkan, menurut model ini, proporsi respons yang termasuk dalam setiap sel tabel 2x2 di atas ditentukan oleh:
- Proporsi relatif uji coba sampel dari distribusi hijau dan merah (tingkat dasar)
- Kriteria yang dipilih oleh pengamat
- Pemisahan antara distribusi
- Varian dari setiap distribusi
- Segala penyimpangan dari persamaan varian di antara distribusi (persamaan perbedaan dijelaskan di atas)
- Bentuk setiap distribusi (keduanya adalah Gaussian di atas)
Seringkali pengaruh # 5 dan # 6 hanya dapat dinilai dengan membuat pengamat membuat keputusan di sejumlah level kriteria yang berbeda, jadi kita akan mengabaikannya untuk saat ini. Selain itu, # 3 dan # 4 hanya masuk akal relatif terhadap satu sama lain (mis. Seberapa besar pemisahan relatif terhadap variabilitas distribusi?), Dirangkum dengan ukuran "diskriminasi" (juga dikenal sebagai d '). Dengan demikian, teori deteksi sinyal menetapkan estimasi dua properti dari data deteksi sinyal: kriteria & diskriminasi.
Namun, saya sering memperhatikan bahwa laporan penelitian (terutama dari bidang medis) gagal menerapkan kerangka deteksi sinyal dan bukannya mencoba menganalisis jumlah seperti "Nilai prediksi positif", "Nilai prediksi negatif", "Sensitivitas", dan "Spesifisitas". ", yang semuanya mewakili nilai marginal yang berbeda dari tabel 2x2 di atas ( lihat di sini untuk elaborasi ).
Utilitas apa yang disediakan properti marginal ini? Kecenderungan saya adalah mengabaikan mereka sepenuhnya karena mereka mengacaukan pengaruh kriteria dan diskriminasi yang secara teoretis independen, tetapi mungkin saya hanya kurang memiliki imajinasi untuk mempertimbangkan manfaatnya.