Uji permutasi membandingkan sampel tunggal dengan rata-rata

Ketika orang menerapkan tes permutasi untuk membandingkan sampel tunggal dengan rata-rata (misalnya, seperti yang Anda lakukan dengan uji-permutasi), bagaimana cara rata-rata ditangani? Saya telah melihat implementasi yang mengambil mean dan sampel untuk tes permutasi, tetapi tidak jelas apa yang sebenarnya mereka lakukan di bawah tenda. Apakah ada cara yang bermakna untuk melakukan tes permutasi (misalnya, uji-t) untuk satu sampel versus asumsi yang diasumsikan? Atau, sebagai alternatif, apakah mereka hanya gagal pada uji non-permutasi di bawah tenda? (misalnya, meskipun memanggil fungsi permutasi atau menyetel flag uji permutasi, default ke uji-t standar atau fungsi serupa)

Dalam uji permutasi dua sampel standar, seseorang akan memiliki dua kelompok dan mengacak penugasan label. Namun, bagaimana hal ini ditangani ketika satu "kelompok" dianggap sebagai rata-rata? Jelas, rata-rata yang diasumsikan tidak memiliki ukuran sampel dalam dan dari dirinya sendiri. Jadi, bagaimana cara kerja rata-rata dalam format permutasi? Apakah sampel "rata-rata" diasumsikan sebagai satu titik? Sampel dengan ukuran yang sama dengan kelompok sampel? Sampel berukuran tak terbatas?

Mengingat bahwa mean yang diasumsikan adalah, yah, diasumsikan- Saya akan mengatakannya secara teknis memiliki dukungan tak terbatas atau dukungan apa pun yang ingin Anda asumsikan untuk itu. Namun, tak satu pun dari ini sangat berguna untuk perhitungan yang sebenarnya. Sampel berukuran sama dengan nilai semua sama dengan rata-rata tampaknya apa yang dilakukan kadang-kadang dengan beberapa tes (misalnya, Anda hanya mengisi setengah dari pasangan dengan lokasi yang diasumsikan). Ini masuk akal, karena sampel dengan panjang yang sama akan Anda lihat jika asumsi rata-rata Anda benar tanpa varians.

Jadi pertanyaan saya adalah ini: Dalam praktiknya, apakah orang benar-benar meniru pengacakan label gaya permutasi-tes ketika set kedua adalah rata-rata (atau nilai asumsi abstrak serupa)? Jika demikian, bagaimana orang menangani pengacakan label ketika mereka melakukan ini?

t-test permutation-test

— Bernama
sumber

Tes permutasi dari rata-rata yang dihipotesiskan spesifik tidak berbeda dengan mengurangi rata-rata yang dihipotesiskan dari data dan menguji terhadap rata-rata nol. Tes berpasangan dibahas di sini ; itu membuat asumsi bahwa di bawah nol pasangan memiliki distribusi yang sama, yang menyiratkan perbedaan di mana tes satu sampel berikutnya didasarkan diasumsikan simetris. Atas dasar itu, tanda-tanda dibalik secara acak pada setiap perbedaan ... (

— ctd

(ctd) ... (yang untuk tes berpasangan setara dengan membalik label grup). Nah itu untuk tes pengacakan - untuk tes permutasi penuh Anda akan melakukan semua kemungkinan kombinasi dari tanda-membalik. Jika Anda tidak dapat mengasumsikan simetri, agak sulit untuk melihat apa yang akan Anda permutasi - tetapi Anda masih dapat melakukan tes bootstrap.

2^{n}

$2^n$

— Glen_b -Reinstate Monica

Itu masuk akal. Tapi saya berpikir sedikit dari implementasi komputasi yang dilakukan orang. Jika Anda bisa mengubahnya menjadi tes tanda, apakah orang benar-benar repot menghitung permutasi? Untuk setiap urutan panjang N, set lengkap permutasi tanda terbalik akan sama, bukan? Jadi saya akan berpikir bahwa di bawah tenda, orang mungkin hanya menyalurkannya ke tes binomial daripada secara manual menghasilkan permutasi yang membuat distr binomial. Saya terutama bertanya-tanya apakah / ketika ada manfaat untuk pelabelan ulang & permutasi dibandingkan menggunakan tes standar dalam sampel tunggal vs mean case.

— Namey

Saya tidak menyarankan mengubahnya menjadi tes tanda sama sekali. Di bawah skema saya disucssing tanda-tanda diijinkan tetapi nilai absolut dari data asli dipertahankan; yang permutasi adalahdi mana adalah atau . Yaitu, jika adalah 11,43 dalam satu tes sampel terhadap rata-rata nol, permutasi akan menjadi -11,43 atau +11,43. Jika Anda menentukan peringkat data absolut terlebih dahulu, Anda akan benar-benar berakhir dengan tes peringkat bertanda Wilcoxon, jadi itu seperti versi (data asli) yang tidak di -rank.

k^{th}

$k^\text{th}$

x_{i}

$x_i$

s_{i}^{[k]} | x_{i} |

$s_i^{[k]} |x_i|$

s

$s$

+ 1

$+1$

- 1

$-1$

x_{10}

$x_{10}$

x_{10}

$x_{10}$

— Glen_b -Reinstate Monica

Memperluas komentar Glen_b menjadi jawaban

Uji permutasi satu sampel perkiraan untuk rata-rata sampel, terhadap hipotesis nol dari rata-rata nol, dilaksanakan dengan menetapkan tanda-tanda acak ke data dalam sampel. Hipotesis nol nol dapat diuji dengan mengurangi mean nol yang diinginkan dari data.

Ini mudah dilihat di sumber fungsi R onetPermutationdalam paket DAAG. Berikut kutipan kode yang relevan, dengan komentar yang saya tambahkan:

function (x, nsim) {

  ## Initialize and pre-allocate

  n <- length(x)
  dbar <- mean(x)
  absx <- abs(x)  # there's actually a bug in the code; below you'll see that the function ends up re-computing abs(x) instead of using this
  z <- array(, nsim)


  ## Run the simulation    

  for (i in 1:nsim) {                             # Do nsim times:
      mn <- sample(c(-1, 1), n, replace = TRUE)   #  1. take n random draws from {-1, 1}, where n is the length of the data to be tested
      xbardash <- mean(mn * abs(x))               #  2. assign the signs to the data and put them in a temporary variable
      z[i] <- xbardash                            #  3. save the new data in an array
  }


  ## Return the p value
  # p = the fraction of fake data that is:
  #      larger than |sample mean of x|, or
  #    smaller than -|sample mean of x|

  (sum(z >= abs(dbar)) + sum(z <= -abs(dbar)))/nsim
}

— shadowtalker
sumber