Metode perbandingan multipel mana yang digunakan untuk model lmer: lsmeans atau glht?

Saya menganalisis set data menggunakan model efek campuran dengan satu efek tetap (kondisi) dan dua efek acak (peserta karena desain subjek dan pasangan dalam). Model ini dihasilkan dengan lme4paket: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp).

Selanjutnya, saya melakukan uji rasio kemungkinan model ini terhadap model tanpa efek tetap (kondisi) dan memiliki perbedaan yang signifikan. Ada 3 kondisi dalam kumpulan data saya jadi saya ingin melakukan beberapa perbandingan tetapi saya tidak yakin metode mana yang digunakan . Saya menemukan sejumlah pertanyaan serupa di CrossValidated dan forum lain tetapi saya masih cukup bingung.

Dari apa yang saya lihat, orang menyarankan untuk menggunakan

1. The lsmeanspaket - lsmeans(exp.model,pairwise~condition)yang memberikan saya output berikut:

condition     lsmean         SE    df  lower.CL  upper.CL
 Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089
 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443
 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552

Confidence level used: 0.95 

$contrasts
 contrast                   estimate         SE    df t.ratio p.value
 Condition1 - Condition2 -0.04893538 0.03813262 62.07  -1.283  0.4099
 Condition1 - Condition3 -0.10424628 0.03813262 62.07  -2.734  0.0219
 Condition2 - Condition3 -0.05531090 0.03813262 62.07  -1.450  0.3217

P value adjustment: tukey method for comparing a family of 3 estimates

2. The multcomppaket dalam dua cara yang berbeda - menggunakan mcp glht(exp.model,mcp(condition="Tukey"))mengakibatkan

     Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: Tukey Contrasts


Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair), 
    data = exp, REML = FALSE)

Linear Hypotheses:
                             Estimate Std. Error z value Pr(>|z|)  
Condition2 - Condition1 == 0  0.04894    0.03749   1.305    0.392  
Condition3 - Condition1 == 0  0.10425    0.03749   2.781    0.015 *
Condition3 - Condition2 == 0  0.05531    0.03749   1.475    0.303  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)

dan menggunakan lsm glht(exp.model,lsm(pairwise~condition))menghasilkan

Note: df set to 62

     Simultaneous Tests for General Linear Hypotheses

Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair), 
    data = exp, REML = FALSE)

Linear Hypotheses:
                             Estimate Std. Error t value Pr(>|t|)  
Condition1 - Condition2 == 0 -0.04894    0.03749  -1.305   0.3977  
Condition1 - Condition3 == 0 -0.10425    0.03749  -2.781   0.0195 *
Condition2 - Condition3 == 0 -0.05531    0.03749  -1.475   0.3098  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)

Seperti yang Anda lihat, metode ini memberikan hasil yang berbeda. Ini adalah pertama kalinya saya bekerja dengan R dan statistik sehingga ada sesuatu yang salah tetapi saya tidak tahu di mana. Pertanyaan saya adalah:

Apa perbedaan antara metode yang disajikan? Saya membaca dalam jawaban untuk pertanyaan terkait bahwa ini tentang derajat kebebasan ( lsmeansvs. glht). Apakah ada beberapa aturan atau rekomendasi kapan harus menggunakan yang mana, yaitu, metode 1 baik untuk jenis set data / model dll.? Hasil mana yang harus saya laporkan? Tanpa tahu lebih baik, saya mungkin akan pergi dan melaporkan nilai p tertinggi yang saya dapatkan agar aman, tetapi alangkah baiknya memiliki alasan yang lebih baik. Terima kasih

r repeated-measures multiple-comparisons post-hoc lsmeans bayesian posterior marginal integral anova time-series regularization machine-learning pca computational-statistics references inference regression cross-validation python random-forest chi-squared spearman-rho r machine-learning confidence-interval bagging clustering feature-selection model-selection bic hypothesis-testing kurtosis r regression residuals terminology

— schvaba986
sumber

Bukan jawaban yang lengkap ...

Perbedaan antara glht(myfit, mcp(myfactor="Tukey"))dan dua metode lain adalah bahwa cara ini menggunakan statistik "z" (distribusi normal), sedangkan yang lain menggunakan statistik "t" (distribusi Siswa). Statistik "z" sama dengan statistik "t" dengan tingkat kebebasan tanpa batas. Metode ini asimtotik dan memberikan nilai p yang lebih kecil dan interval kepercayaan yang lebih pendek daripada yang lain. Nilai-p bisa terlalu kecil dan interval kepercayaan bisa terlalu pendek jika dataset kecil.

Ketika saya menjalankan lsmeans(myfit, pairwise~myfactor)pesan berikut muncul:

Loading required namespace: pbkrtest

Itu berarti bahwa lsmeans(untuk lmermodel) menggunakan pbkrtestpaket yang mengimplementasikan metode Kenward & Rogers untuk derajat kebebasan statistik "t". Metode ini bermaksud untuk memberikan nilai-p dan interval kepercayaan yang lebih baik daripada yang asimptotik (tidak ada perbedaan ketika tingkat kebebasannya besar).

Sekarang, tentang perbedaan antara lsmeans(myfit, pairwise~myfactor)$contrastsdan glht(myfit, lsm(pairwise~factor), saya baru saja melakukan beberapa tes dan pengamatan saya adalah sebagai berikut:

lsmadalah antarmuka antara lsmeanspaket dan multcomppaket (lihat ?lsm)
untuk desain yang seimbang tidak ada perbedaan antara hasilnya
untuk desain yang tidak seimbang, saya mengamati perbedaan kecil antara hasil (kesalahan standar dan rasio t)

Sayangnya saya tidak tahu apa penyebab perbedaan ini. Sepertinya lsmpanggilan lsmeanshanya untuk mendapatkan matriks hipotesis linier dan derajat kebebasan, tetapi lsmeansmenggunakan cara berbeda untuk menghitung kesalahan standar.

— Stéphane Laurent
sumber

Terima kasih atas respon yang mendetail! Saya melewatkan perbedaan dalam statistik uji sepenuhnya ... Anda menyebutkan bahwa nilainya bisa terlalu kecil dan CI terlalu sempit untuk metode asimptotik. Kumpulan data saya terdiri dari ~ 30 peserta jadi saya kira saya akan tetap menggunakan statistik-t. Ketika Anda mengatakan bahwa metode Kenward & Rogers mengarah ke nilai-p yang lebih baik, maksud Anda lebih akurat atau lebih kecil? Jadi perbedaannya adalah karena perbedaan dalam metode perhitungan df dan SE dan tidak ada karena penggunaan salah satu dari mereka dengan model saya, jika saya mengerti Anda dengan benar. Apakah ada cara untuk memilih metode "terbaik" di sini?

— schvaba986

(Saya adalah pengembang paket lsmeans ) lsmeansmenggunakan paket pbkrtest, yang menyediakan untuk (1) perhitungan dw Kenward-Rogers dan (2) matriks kovarians yang disesuaikan dengan pengurangan bias dalam estimasi. Jika pertama kali Anda atur lsm.options(disable.pbkrtest=TRUE), maka lsmeanspanggilan dengan adjust="mvt"akan menghasilkan hasil yang sama denganglht , kecuali untuk sedikit perbedaan karena algoritma acak yang digunakan oleh kedua paket untuk distribusi t multivarian.

— Russ Lenth

Namun, saya menyarankan penyesuaian "mvt" tanpa menonaktifkan pbkrtest, karena penyesuaian bias dan fakta bahwa tanpa nilai df, asimptotik (z) pada dasarnya mengasumsikan df tanpa batas, sehingga menghasilkan nilai P rendah yang tidak realistis.

— Russ Lenth

Omong-omong, summarymetode untuk glhtmemungkinkan berbagai metode pengujian step-down selain penyesuaian multiplisitas satu langkah (simultan simultan) standar. Pada titik yang sama sekali berbeda, jika Anda memiliki lebih dari satu faktor, lsmdapat membuat jenis perbandingan yang biasa dengan mudah, sementara mcptidak dapat melakukannya sama sekali.

— Russ Lenth