Apa intuisi di balik sampel yang dapat ditukar di bawah hipotesis nol?


15

Tes permutasi (juga disebut tes pengacakan, uji pengacakan ulang, atau tes yang tepat) sangat berguna dan berguna ketika asumsi distribusi normal yang diperlukan misalnya, t-testtidak terpenuhi dan ketika transformasi nilai dengan peringkat dari tes non-parametrik seperti Mann-Whitney-U-testakan menyebabkan lebih banyak informasi hilang. Namun, satu dan hanya satu asumsi yang tidak boleh diabaikan ketika menggunakan tes semacam ini adalah asumsi pertukaran dari sampel di bawah hipotesis nol. Juga perlu dicatat bahwa pendekatan semacam ini juga dapat diterapkan ketika ada lebih dari dua sampel seperti apa yang diterapkan dalam coinpaket R.

Bisakah Anda menggunakan beberapa bahasa kiasan atau intuisi konseptual dalam bahasa Inggris sederhana untuk menggambarkan asumsi ini? Ini akan sangat berguna untuk memperjelas masalah yang diabaikan ini di kalangan non-ahli statistik seperti saya.

Catatan:
Akan sangat membantu untuk menyebutkan kasus di mana penerapan tes permutasi tidak berlaku atau tidak valid dengan asumsi yang sama.

Pembaruan:
Misalkan saya memiliki 50 subjek yang dikumpulkan dari klinik lokal di distrik saya secara acak. Mereka secara acak ditugaskan untuk menerima obat atau plasebo dengan perbandingan 1: 1. Mereka semua diukur untuk paramerter 1 Par1di V1 (baseline), V2 (3 bulan kemudian), dan V3 (1 tahun kemudian). Semua 50 subjek dapat dibagi menjadi 2 kelompok berdasarkan fitur A; A positif = 20 dan A negatif = 30. Mereka juga dapat dikelompokkan menjadi 2 kelompok lain berdasarkan fitur B; B positif = 15 dan B negatif = 35.
Sekarang, saya memiliki nilai Par1dari semua mata pelajaran di semua kunjungan. Dengan asumsi pertukaran, dapatkah saya melakukan perbandingan antara tingkat Par1menggunakan tes permutasi jika saya akan:
- Membandingkan subyek dengan obat dengan yang menerima plasebo di V2?
- Bandingkan subjek dengan fitur A dengan yang memiliki fitur B di V2?
- Bandingkan subjek yang memiliki fitur A di V2 dengan yang memiliki fitur A tetapi di V3?
- Dalam situasi apa perbandingan ini tidak valid dan akan melanggar asumsi pertukaran?

hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
Misalkan saya memiliki setiap pengamatan pada selembar kertas lepas yang terpisah dan ketika saya menyerahkan tumpukan itu, saya tergelincir, dan lembaran itu terbang ke segala arah ketika mereka duduk di lantai. Akan memalukan jika itu menghancurkan validitas tes yang Anda harapkan untuk dilakukan pada data tersebut. Jika pengamatan Anda dapat dipertukarkan dan Anda menerapkan tes berdasarkan itu, Anda akan menghibur saya dan mengatakan kepada saya untuk tidak khawatir sambil membantu saya mengumpulkan kertas dari lantai. Jika tidak, dan pengumpulan datanya sangat mahal, saya mungkin harus berlari untuk hidup saya.
kardinal

2
Di sisi lain, pesanan memang penting untuk hal-hal seperti data deret waktu (secara umum) dan pengujian umumnya harus menghormati pesanan ini dengan cara yang tepat.
kardinal

@ kardinal, sementara cerita intuitif Anda telah menggambar gambaran yang jelas tentang bagaimana asumsi ini terlihat, tetapi saya masih bingung bagaimana cara menilai apakah kertas berharga yang jatuh dapat ditukar atau tidak. Anda dapat mencalonkan diri untuk komentar lain jika memungkinkan!
gelar doktor

Jawaban:


7

fXYZ(x=1,y=3,z=2)=fXYZ(x=3,y=2,z=1), dll). Jika ini bukan kasusnya maka penghitungan permutasi bukan cara yang valid untuk menguji hipotesis nol, karena setiap permutasi akan memiliki bobot yang berbeda (probabilitas / kepadatan). Tes permutasi tergantung pada masing-masing penugasan dari serangkaian nilai numerik untuk variabel Anda yang memiliki kepadatan / probabilitas yang sama.

f(x1=1,x2=2,X3=3 ...XN=N)f(x1=N,x2=N-1,X3=N-2 ...XN=1)jadi Anda tidak bisa hanya menghitung permutasi dari nilai 1 sampai N. Secara umum, pertukaran dapat gagal ketika sampel Anda dapat dikelompokkan menjadi sub-kelompok (seperti yang telah saya lakukan dengan stoples). Pertukaran akan dikembalikan jika, contoh mengambil 1 sampel dari N guci, Anda mengambil sampel N dari 1 jar. Kemudian, distribusi gabungan akan menjadi invarian terhadap permutasi.


+1, meskipun pertukarannya dijelaskan dengan baik tetapi saya masih tersandung mencoba menerapkan metafora guci pada studi di tangan. (lihat pembaruan pertanyaan). Mengingat lamanya kunjungan, dan pengelompokan berdasarkan fitur, bagaimana saya bisa menilai apakah perbandingan nilai-nilai ini dapat ditukar atau tidak?
gelar doktor

@doctorate: sepertinya Anda mengelompokkan grup Anda berdasarkan faktor-faktor yang relevan dengan hasil Par1, benar? Selama Anda menggunakan permutasi dalam kuadran feture A / B tertentu, maka saya akan menganggap subyek Anda dapat dipertukarkan. Tes pertama Anda, yang akan melintasi fitur-fitur, perlu diproses lebih lanjut sebelum Anda dapat menggunakan tes yang bergantung pada pertukaran. khususnya, Anda perlu mengukur efek dari perawatan dan mengoreksi efek perancu dari fitur A dan B - jika tidak, ukuran goup akan memengaruhi hasil keseluruhan (paradoks simpson)

1
@doctorate: Saya menyadari bahwa komentar saya di atas mungkin agak miring seperti yang Anda inginkan: toples dalam kasus Anda adalah pasangan fitur, yaitu (A +, B +), (A-, B +), (A +, B -), (B-, A-) dengan total 4 "stoples". Apakah itu membantu membuatnya menjadi lebih konkret?

Tks, tetapi yang membingungkan non-ahli statistik seperti saya, adalah bagaimana seseorang dapat menilai apakah asumsi ini dipenuhi atau tidak? sering ada tes untuk memeriksa asumsi, misalnya, untuk normalitas ada tes Shapiro-Wilk. Tapi saya ingin tahu tes apa yang akan menguji pertukaran? kalau tidak, definisi itu akan sangat sulit atau kabur dan dua ahli statistik mungkin tidak menyetujui subkelompok ini atau itu. Seperti yang Anda sebutkan, dalam kuadran A / B tidak ada masalah, tetapi dalam Obat / Placebo Anda menunjukkan kekhawatiran. Jadi adakah tes asam untuk asumsi ini?
gelar doktor

2
Sejauh pertukaran, tidak ada "tes" untuk pertukaran. Tidak seperti independensi (yang dapat diuji), pertukaran adalah lebih dari asumsi pemodelan yang telah Anda ambil sampel berulang seperti yang Anda ambil, Anda akan menemukan bahwa setiap permutasi terjadi persis sama dengan fraksi waktu. Anda hanya memiliki 1 sampel, jadi Anda tidak dapat "mengujinya".
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.