Saya akan merekayasa balik ini dari pengalaman dengan kasus-kasus diskriminasi. Saya pasti bisa menentukan dari mana nilai "satu dalam 741," dll , berasal. Namun, begitu banyak informasi yang hilang dalam terjemahan sehingga sisa rekonstruksi saya bergantung pada bagaimana orang melakukan statistik dalam pengaturan ruang sidang. Saya hanya bisa menebak beberapa detail.
Sejak undang-undang anti-diskriminasi disahkan pada 1960-an (Judul VI), pengadilan di Amerika Serikat telah belajar untuk melihat nilai-p dan membandingkannya dengan ambang batas dan 0,01 . Mereka juga telah belajar untuk melihat efek standar, biasanya disebut sebagai "standar deviasi," dan membandingkannya dengan ambang batas "dua hingga tiga standar deviasi." Untuk membuat kasus prima facie untuk gugatan diskriminasi, penggugat biasanya mencoba perhitungan statistik yang menunjukkan "dampak berbeda" yang melebihi ambang batas ini. Jika perhitungan seperti itu tidak dapat didukung, kasing biasanya tidak bisa maju.0.050.01
Pakar statistik untuk penggugat sering berupaya untuk mengutarakan hasil mereka dalam istilah yang sudah lazim ini. Beberapa ahli melakukan tes statistik di mana hipotesis nol menyatakan "tidak ada dampak buruk," dengan asumsi keputusan kerja adalah murni acak dan tidak diatur oleh karakteristik karyawan lainnya. (Apakah itu alternatif satu-ekor atau dua-ekor mungkin tergantung pada ahli dan keadaannya.) Mereka kemudian mengubah nilai-p tes ini menjadi sejumlah "standar deviasi" dengan merujuknya ke distribusi Normal standar- - bahkan ketika standar Normal tidak relevan dengan tes asli. Dengan cara bundaran ini mereka berharap untuk mengomunikasikan kesimpulan mereka dengan jelas kepada hakim.
Tes yang disukai untuk data yang dapat diringkas dalam tabel kontingensi adalah Uji Exact Fisher. Terjadinya "Tepat" dalam namanya sangat menyenangkan bagi penggugat, karena berkonotasi penentuan statistik yang telah dibuat tanpa kesalahan (apa pun itu!).
Jadi, inilah perhitungan saya (rekonstruksi spekulatif) dari Departemen Tenaga Kerja.
Mereka menjalankan Fisher's Exact Test, atau semacamnya (seperti tes dengan nilai-p yang ditentukan melalui pengacakan). Tes ini mengasumsikan distribusi hypergeometric seperti yang dijelaskan dalam jawaban Matthew Gunn. (Untuk sejumlah kecil orang yang terlibat dalam keluhan ini, distribusi hipergeometrik tidak diperkirakan dengan baik oleh distribusi Normal.)χ2
Mereka mengonversi nilai p-nya ke skor Z normal ("jumlah standar deviasi").
Mereka membulatkan skor Z ke bilangan bulat terdekat: "melebihi tiga standar deviasi," "melebihi lima standar deviasi," dan "melebihi enam standar deviasi." (Karena beberapa dari Z-skor mengitari up penyimpangan lebih standar, saya tidak bisa membenarkan "melebihi", semua bisa saya lakukan adalah mengutipnya.)
Dalam keluhan, skor Z integral ini dikonversi kembali ke nilai-p! Sekali lagi standar distribusi normal digunakan.
Nilai-p ini digambarkan (bisa dibilang dengan cara yang menyesatkan) sebagai "kemungkinan bahwa hasil ini terjadi sesuai dengan kebetulan."
1/12801/5650001/5800000073011601307301160130−3.16−4.64−5.521/7411/35000001/1000000000
Berikut adalah beberapa R
kode yang digunakan untuk melakukan perhitungan ini.
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))