Bagaimana cara menguji efek interaksi dengan tes non-parametrik (misalnya tes permutasi)?


10

Saya memiliki dua variabel kategori / nominal. Masing-masing hanya dapat mengambil dua nilai berbeda (jadi, saya memiliki total 4 kombinasi).

Setiap kombinasi nilai dilengkapi dengan satu set nilai numerik. Jadi, saya punya 4 set angka. Untuk membuatnya lebih konkret, mari kita katakan bahwa saya memiliki male / femaledan young / oldsebagai variabel nominal dan saya memiliki weightsebagai "output" numerik dependen.

Saya tahu bahwa transisi dari maleke femaletidak mengubah bobot rata-rata dan perubahan ini signifikan secara statistik. Jadi, saya bisa menghitung genderfaktor. Hal yang sama berlaku untuk agevariabel. Saya tahu bahwa transisi dari youngke oldtidak mengubah berat rata-rata dan saya dapat menghitung agefaktor yang sesuai .

Sekarang, apa yang benar-benar ingin saya lihat jika data membuktikan bahwa transisi dari perempuan muda ke laki-laki lebih dari kombinasi faktor gender dan usia. Dengan kata lain, saya ingin tahu apakah data membuktikan bahwa ada "efek 2D" atau, dengan kata lain, bahwa efek usia dan gender tidak independen. Sebagai contoh, mungkin bahwa menjadi tua bagi pria meningkatkan berat dengan faktor 1.3 dan untuk wanita faktor yang sesuai adalah 1.1.

Tentu saja saya dapat menghitung dua faktor yang disebutkan (faktor usia untuk pria dan faktor usia untuk wanita) dan mereka berbeda. Tetapi saya ingin menghitung signifikansi statistik dari perbedaan ini. Seberapa nyata perbedaan ini?

Saya ingin melakukan tes non-parametrik, jika memungkinkan. Apakah mungkin untuk melakukan apa yang ingin saya lakukan dengan mencampur empat set, mengocoknya, membelah kembali dan menghitung sesuatu.


2
Salah satu kesulitan dalam berurusan dengan interaksi secara nonparametrik adalah bahwa transformasi respons yang monoton dapat menghilangkan interaksi yang ada, mendorong interaksi di tempat yang tidak ada, atau membalik arah interaksi. Ini menunjukkan bahwa pendekatan berbasis pangkat, misalnya, mungkin tidak melakukan apa yang Anda harapkan.
Glen_b -Reinstate Monica

Dengan tes permutasi pada variabel asli, Anda tidak memiliki masalah itu tetapi ternyata tidak ada tes yang tepat untuk interaksi. Anda bisa mendapatkan beberapa tes perkiraan.
Glen_b -Reinstate Monica

Jawaban:


5

Ada tes nonparametrik untuk interaksi. Secara kasar, Anda mengganti bobot yang diamati dengan peringkat mereka dan memperlakukan data yang dihasilkan ditetapkan sebagai ANOVA heteroskedastik. Lihat misalnya di "Metode nonparametrik dalam desain faktorial" oleh Brunner dan Puri (2001).

Namun, jenis interaksi nonparametrik yang Anda minati tidak dapat ditampilkan dalam generalitas ini. Kamu berkata:

Dengan kata lain, saya ingin tahu apakah data membuktikan bahwa ada "efek 2D" atau, dengan kata lain, bahwa efek usia dan gender tidak independen. Sebagai contoh, mungkin bahwa menjadi tua bagi pria meningkatkan berat dengan faktor 1.3 dan untuk wanita faktor yang sesuai adalah 1.1.

Yang terakhir tidak mungkin. Interaksi nonparametrik harus melibatkan perubahan tanda, yaitu bertambah tua meningkatkan berat badan laki-laki tetapi mengurangi berat perempuan. Perubahan tanda seperti itu tetap ada bahkan jika Anda mengubah bobot secara monoton. Tetapi Anda dapat memilih transformasi monoton pada data yang memetakan kenaikan berat dengan faktor 1.1 sedekat yang Anda inginkan ke 1.3. Tentu saja, Anda tidak akan pernah menunjukkan perbedaan untuk menjadi signifikan jika bisa sedekat yang Anda inginkan.

Jika Anda benar-benar tertarik pada interaksi tanpa perubahan tanda, Anda harus tetap berpegang pada analisis parametrik biasa. Di sana, transformasi monoton yang "menelan perbedaan" tidak diperbolehkan. Tentu saja, ini lagi sesuatu yang perlu diingat dengan memodelkan dan menafsirkan statistik Anda.


1

Jika Anda yakin bahwa efek dari usia dan jenis kelamin yang lebih dari sekedar efek individu, Anda dapat mempertimbangkan model The γweighti=αagei+βgenderi+γ(genderiagei).γKoefisien menangkap ukuran efek "2D" usia dan jenis kelamin. Anda dapat memeriksa t-statistik untuk mendapatkan gambaran kasar tentang apakah γ yang Anda amati dalam model Anda secara signifikan berbeda dari γ = 0 .γγγ=0

Berikut adalah contoh grafis yang sangat kasar untuk menunjukkan apa ini tambahan perkalian jangka tidak.genderiagei

Dalam model , kami pada dasarnya mencoba untuk menyesuaikan hyperplane sederhana dengan dataresponse=x1+x2

masukkan deskripsi gambar di sini

Model ini linear dalam kovariat, maka bentuk linear yang Anda lihat dalam plot di atas.

response=x1+x2+x1x2x1x2

masukkan deskripsi gambar di sini

γ=0

γγ^γ^50±p%2p%γ


Bagaimana ini bisa non-linear jika x1 dan x2 hanya dapat mengambil nilai 0 atau 1? Bagaimana gamma dalam contoh Anda menjelaskan segala bentuk kelengkungan?
5ayat

αR2:x1+x2+x1x2=i=12αixi

Saya akan menambahkan, bagaimanapun, bahwa ketika domain adalah biner (yang seperti. Simpul dari kubus 2D), Anda dapat memperlakukan fungsi ini secara linear. Tetapi bentuk fungsionalnya sangat non-linear.
Mustafa S Eisa

@MustafaMEisa, saya belum pernah melihat istilah interaksi dalam model linier yang dijelaskan dalam istilah "simpul kubus 2D." Akan informatif jika Anda bisa menguraikan.
5ayat

@ HorstGrünbusch, saya juga ingin tahu komentar Anda tentang jawaban ini, karena Anda telah memberikan komentar yang bermanfaat pada jawaban saya.
5ayat

1

wt=α+b1age+b2gender+b3agegender+ϵ

wtgender=b2+b3age

gender=0age=0gender=1age=1gender=0age=1gender=1age=0

wt=α+b1young.male+b2old.male+b3young.female+ϵ

old.femaleb1old.femaleyoung.maleαwtold.female

Contoh-contoh di atas dengan demikian merupakan cara yang terlalu rumit untuk sampai pada kesimpulan ini (bahwa kita benar-benar hanya membandingkan empat cara kelompok), tetapi untuk belajar tentang bagaimana interaksi bekerja, saya pikir ini adalah latihan yang bermanfaat. Ada posting lain yang sangat bagus di CV tentang interaksi variabel kontinu dengan variabel nominal, atau interaksi dua variabel kontinu. Meskipun pertanyaan Anda telah diedit untuk menentukan tes non-parametrik, saya pikir akan membantu untuk memikirkan masalah Anda dari pendekatan yang lebih konvensional (yaitu, parametrik), karena sebagian besar pendekatan non-parametrik untuk pengujian hipotesis memiliki logika yang sama tetapi umumnya dengan lebih sedikit asumsi tentang distribusi tertentu.

wt

old.menyoung.women

Mengesampingkan interaksi "signifikan"

x1x2x1x2Tetapi sekali lagi, jika kita hanya memiliki dua kovariat yang hanya dapat mengambil nilai 0 atau 1, itu berarti bahwa kita pada dasarnya melihat empat cara kelompok.

Contoh yang berhasil

Mari kita bandingkan hasil dari model interaksi dengan hasil dari uji Dunn. Pertama, mari kita hasilkan beberapa data di mana (a) pria berbobot lebih dari wanita, (b) pria yang lebih muda beratnya lebih rendah daripada pria yang lebih tua, dan (c) tidak ada perbedaan antara wanita yang lebih muda dan lebih tua.

set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))

wt

mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)

 model: wt ~ age * gender

 age*gender effect
       gender
age         male   female
  old   80.61897 57.70635
  young 67.78351 56.01228

Perlu menghitung kesalahan standar atau interval kepercayaan untuk efek marginal Anda? Paket 'efek' yang dirujuk di atas dapat melakukan ini untuk Anda, tetapi lebih baik lagi, Aiken dan Barat (1991) memberi Anda formula, bahkan untuk model interaksi yang jauh lebih rumit. Meja mereka dicetak dengan nyaman di sini , bersama dengan komentar yang sangat bagus dari Matt Golder.

Sekarang untuk mengimplementasikan tes Dunn.

#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")

Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0


                           Comparison of x by group                            
                             (Benjamini-Hochberg)                              
Col Mean-|
Row Mean |    old.men   young.me   young.wo
---------+---------------------------------
young.me |   3.662802
         |    0.0002*
         |
young.wo |   7.185657   3.522855
         |    0.0000*    0.0003*
         |
old.wome |   6.705346   3.042544  -0.480310
         |    0.0000*    0.0014*     0.3155

Nilai p pada hasil uji chi-squared Kruskal-Wallis menunjukkan bahwa setidaknya satu dari kelompok kami 'berasal dari populasi yang berbeda.' Untuk perbandingan kelompok per kelompok, angka atas adalah statistik uji-Dunn, dan angka bawah adalah nilai-p, yang telah disesuaikan untuk beberapa perbandingan. Karena data contoh kami agak palsu, tidak mengherankan bahwa kami memiliki begitu banyak nilai p. Tetapi perhatikan perbandingan kanan bawah antara wanita yang lebih muda dan lebih tua. Tes dengan benar mendukung hipotesis nol bahwa tidak ada perbedaan antara kedua kelompok ini.

UPDATE: Diberikan jawaban lain, jawaban ini telah diperbarui untuk membantah gagasan bahwa ini memerlukan segala bentuk pemodelan non-linear, atau yang - diberikan contoh khusus OP dari dua kovariat biner, yaitu, empat kelompok - bahwa harus ada menandatangani perubahan untuk menilai ini secara non-parametrik. Jika usia terus menerus, misalnya, akan ada cara lain untuk mendekati masalah ini, tetapi itu bukan contoh yang diberikan oleh OP.


Anda tidak menggunakan struktur dua faktor silang. Anda hanya membandingkan empat grup. Tes Dunn bukan tentang interaksi sama sekali.
Horst Grünbusch

Setuju, tes Dunn bukan tentang interaksi. Namun, pertanyaannya menanyakan secara khusus tentang interaksi antara dua variabel biner. Jawaban saya menunjukkan bagaimana ini setara dengan membandingkan keempat kelompok. Jika istilah interaksi baru untuk OP, mudah-mudahan ini adalah ilustrasi yang bermanfaat.
5ayat

1

Jadi, Anda memiliki variabel acak ini:

  • AN
  • S{male,female}
  • W]0,[

Dan Anda memiliki fungsi massa / kepadatan probabilitas ini:

  • fWW
  • fW,AW,A
  • fW,SW,S
  • fW,A,SW,A,S

was

  • fW,A(w,a)fW(w)
  • fW,S(w,s)fW(w)

fW,A,S(w,a,s)fW,A(w,a)fW,S(w,s)

was

Namun, Anda tidak tahu PDF gabungan yang benar di atas. Karena Anda ingin membatasi diri pada metode non-parametrik, tugas Anda sekarang adalah menemukan estimasi non-parametrik ini:

  • f^W,A(w,a)
  • f^W,S(w,s)
  • f^W,A,S(w,a,s)

Dan kemudian tunjukkan bahwa:

  • Perkiraan kepadatan Anda cukup akurat.
  • f^W,A,S(w,a,s)f^W,A(w,a)f^W,S(w,s)
  • f^W,A,S(w,a,s)=f^W,A(w,a)=f^W,S(w,s)

0

Itu akan memeriksa efek interaksi . Linear Modeling akan dapat memeriksa hal seperti itu tetapi tidak non-parametrik jadi saya kira alat lain harus digunakan.

Bagaimana Anda memeriksa agedan genderberlaku hingga sekarang?

EDIT: Jawaban ini sepertinya membantu Anda

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.