(Menarik Conover [1] dari rak buku ...)
Gagasan ini cukup lama; setidaknya kembali ke van der Waerden (1952/1953) [2] [3], yang menyarankan tes yang sesuai dengan Kruskal Wallis tetapi dengan peringkat digantikan oleh skor normal. (Gagasan menggunakan nilai normal acak yang diurutkan daripada perkiraan atau median mereka - mungkin bahkan sedikit lebih tua.)
Menurut Conover, Fisher dan Yates (1957) [4] menyarankan mengganti pengamatan dengan skor normal yang diharapkan (yaitu peringkat yang diubah) dalam berbagai tes di mana normalitas akan diasumsikan.
Efisiensi relatif asimptotik pada normal akan menjadi 1, yang membuatnya terdengar cukup menarik ... namun, kelebihan dibandingkan mengatakan Wilcoxon-Mann-Whitney (mendapatkan kekuatan) - bahkan pada normal - cukup kecil, dan jika distribusi lebih berat dari biasanya (misalkan logistik), mungkin tidak menguntungkan untuk melakukan ini. (Beberapa simulasi menunjukkan bahwa faktanya memang demikian: kecuali jika distribusinya sudah mendekati normal - dalam hal ini tidak ada manfaatnya untuk melakukan transformasi - transformasi semacam itu dapat kehilangan daya.)
Chernoff & Lehmann [5] menghitung daya asimptotik untuk berbagai distribusi; di mana ada setidaknya satu ekor yang sangat pendek (seperti seragam), tes skor normal dapat memiliki ADALAH yang jauh lebih baik untuk alternatif shift melawan Wilcoxon-Mann-Whitney - lebih baik daripada uji-t itu sendiri. Hasil mereka setuju dengan simulasi saya untuk kasus ekor yang lebih berat.
Perhatikan bahwa dalam kasus dua sampel, karena pemisahan dalam sarana menjadi besar, sedangkan sampel gabungan terlihat cukup normal, kedua sampel tidak normal sama sekali:
Akibatnya, tidak semua sifat dari tes normal akan terbawa ke tes skor normal, dan perilaku pada pemisahan yang lebih besar (dengan sampel kecil) mungkin agak berlawanan dengan intuisi.
Tes yang diperoleh oleh ide ini kadang-kadang secara kolektif disebut tes skor normal , yang istilah pencariannya (via Google, katakan) menghasilkan sejumlah referensi.
Sebagai contoh, di sini , Richard Darlington membahas melakukannya untuk ujian peringkat yang ditandatangani Wilcoxon; dia menunjukkan ada keunggulan dibandingkan tes peringkat biasa, karena mengurangi jumlah nilai terikat dari statistik tes.
Sebelum saya akhirnya menulis halaman di atasnya, saya akan meninggalkan Anda untuk mencari lebih jauh.
Conover mendaftar sejumlah referensi lain dan memiliki sedikit diskusi, jadi saya pasti akan merekomendasikan membacanya.
Poin Gelman, bagaimanapun, tampaknya tentang kenyamanan - tidak perlu mengembangkan tes baru setiap kali situasinya berubah; meskipun jika kenyamanan adalah masalah utama sudah ada kemampuan untuk menggunakan tes permutasi pada statistik apa pun yang kita suka. [Dengan pendekatan skor normal, kesulitannya adalah kita masih membutuhkan cara yang sesuai untuk memeringkat - Anda tidak bisa hanya memberi peringkat hal-hal yang tidak sebanding dengan nol dan mengharapkan jenis perilaku yang tepat. Ada masalah serupa dengan tes permutasi, karena Anda juga membutuhkan pertukaran di bawah nol.]
Anda menyebutkan fungsi R, tetapi Anda bisa memberi peringkat dan mengonversi ke skor normal dengan mudah di R hanya menggunakan fungsi yang sudah ada bersama R.
mis. menggunakan sleep
data dalam R. Anda akan melakukan uji-t dengan cara ini:
t.test(extra ~ group, data = sleep) # Welch
t.test(extra ~ group, data = sleep, var.equal=TRUE) # equal-variance
t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep) # normal scores
[1] Conover, WJ (1980),
Praktis Statistik Nonparameter , 2e.
Wiley. hlm. 316–327.
(Dari tautan Wikipedia di atas seperti pada 3e (1999) diskusi dimulai pada hal. 396)
[2] van der Waerden, BL (1952),
"Urutan tes untuk masalah dua sampel dan kekuatan mereka",
Prosiding Koninklijke Nederlandse Akademie van Wetenschappen , Seri A 55 ( Indagationes Mathematicae 14 ), 453–458.
[3] van der Waerden, BL (1953),
"Urutan tes untuk masalah dua sampel. II, III",
Prosiding Koninklijke Nederlandse Akademie van Wetenschappen , Seri A 56 ( Indagationes Mathematicae , 15 ), 303-310 & 311–316.
(ada juga koreksi pada makalah 1952 di halaman 80 dari volume itu)
[4] Fisher RA dan Yates F. (1957)
Tabel Statistik untuk Penelitian Biologis, Pertanian, dan Medis , 5e, Oliver & Boyd, Edinburgh.
[5] Hodges, JL; Lehmann, EL (1961),
"Perbandingan Skor Normal dan Tes Wilcoxon,"
Prosiding Simposium Berkeley Keempat tentang Statistik dan Probabilitas Matematika, Volume 1: Kontribusi Teori Teori Statistik , 307--317,
University of California Press, Berkeley, California.
Http://projecteuclid.org/euclid.bsmsp/1200512171 .