Menemukan kekuatan terhadap alternatif pergeseran skala eksponensial cukup mudah.
Namun, saya tidak tahu bahwa Anda harus menggunakan nilai yang dihitung dari data Anda untuk mengetahui kekuatan apa yang mungkin terjadi. Perhitungan daya post hoc semacam itu cenderung menghasilkan kesimpulan kontra-intuitif (dan mungkin menyesatkan).
Kekuasaan, seperti tingkat signifikansi, adalah fenomena yang Anda hadapi sebelum fakta; Anda akan menggunakan pemahaman apriori (termasuk teori, penalaran atau penelitian sebelumnya) untuk memutuskan serangkaian alternatif yang masuk akal untuk dipertimbangkan, dan ukuran efek yang diinginkan
Anda juga dapat mempertimbangkan berbagai alternatif lain (misalnya Anda dapat menanamkan eksponensial di dalam keluarga gamma untuk mempertimbangkan dampak lebih atau kurang kasus miring).
Pertanyaan biasa yang mungkin bisa dijawab oleh analisis kekuatan adalah:
1) apa kekuatannya, untuk ukuran sampel tertentu, pada beberapa ukuran efek atau serangkaian ukuran efek *?
2) diberi ukuran dan kekuatan sampel, seberapa besar efek yang dapat dideteksi?
3) Diberikan kekuatan yang diinginkan untuk ukuran efek tertentu, ukuran sampel apa yang dibutuhkan?
* (di sini 'ukuran efek' dimaksudkan secara umum, dan mungkin misalnya, rasio rata-rata tertentu, atau perbedaan rata-rata, tidak harus standar).
Jelas Anda sudah memiliki ukuran sampel, jadi Anda tidak dalam kasus (3). Anda mungkin mempertimbangkan kasus (2) atau kasus (1).
Saya menyarankan case (1) (yang juga memberi cara untuk menangani case (2)).
Untuk mengilustrasikan pendekatan pada kasus (1) dan melihat bagaimana hubungannya dengan kasus (2), mari kita pertimbangkan contoh spesifik, dengan:
Karena ukuran sampel berbeda, kami harus mempertimbangkan kasus di mana penyebaran relatif di salah satu sampel lebih kecil dan lebih besar dari 1 (jika ukurannya sama, pertimbangan simetri memungkinkan untuk mempertimbangkan hanya satu sisi). Namun, karena mereka cukup dekat dengan ukuran yang sama, efeknya sangat kecil. Bagaimanapun, perbaiki parameter untuk salah satu sampel dan ubah yang lain.
Jadi yang dilakukan adalah:
Sebelumnya:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
Untuk melakukan perhitungan:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
Di R, saya melakukan ini:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
yang memberikan kekuatan "kurva" berikut
Sumbu x berada pada skala log, sumbu y adalah tingkat penolakan.
Sulit untuk mengatakan di sini, tetapi titik hitam sedikit lebih tinggi di sebelah kiri daripada di sebelah kanan (yaitu, ada kekuatan fraksional lebih besar ketika sampel yang lebih besar memiliki skala yang lebih kecil).
Menggunakan invers normal cdf sebagai transformasi dari tingkat penolakan, kita dapat membuat hubungan antara tingkat penolakan yang ditransformasikan dan log kappa (kappa ada s
di plot, tetapi sumbu x adalah skala-log) sangat hampir linier (kecuali mendekati 0 ), dan jumlah simulasi cukup tinggi sehingga noise sangat rendah - kita bisa mengabaikannya untuk keperluan saat ini.
Jadi kita bisa menggunakan interpolasi linier. Di bawah ini adalah perkiraan ukuran efek untuk daya 50% dan 80% pada ukuran sampel Anda:
Ukuran efek di sisi lain (grup yang lebih besar memiliki skala lebih kecil) hanya sedikit bergeser dari itu (dapat mengambil ukuran efek yang lebih kecil secara fraksional), tetapi itu membuat sedikit perbedaan, jadi saya tidak akan memaksakan intinya.
Jadi tes akan mengambil perbedaan besar (dari rasio skala 1), tetapi bukan yang kecil.
Sekarang untuk beberapa komentar: Saya tidak berpikir tes hipotesis sangat relevan dengan pertanyaan yang mendasari minat ( apakah mereka cukup mirip? ), Dan akibatnya perhitungan daya ini tidak memberi tahu kami apa pun yang secara langsung relevan dengan pertanyaan itu.
Saya pikir Anda menjawab pertanyaan yang lebih berguna dengan menentukan apa yang menurut Anda "pada dasarnya sama" sebenarnya, secara operasional. Itu - yang diupayakan secara rasional untuk aktivitas statistik - harus mengarah pada analisis data yang bermakna.