Penafian saya : Saya menyadari pertanyaan ini tidak aktif selama beberapa waktu, tetapi tampaknya ini penting, dan yang Anda maksudkan untuk mendapatkan banyak tanggapan. Saya seorang Psikolog Sosial, dan dari suaranya, mungkin sedikit lebih nyaman dengan desain seperti itu daripada Henrik (meskipun kekhawatirannya tentang interpretasi kausal benar-benar sah).
Dibawah Kondisi Apa SEM Merupakan Teknik Analisis Data yang Tepat?
Bagi saya, pertanyaan ini sebenarnya ada pada dua sub-pertanyaan yang berbeda:
- Mengapa menggunakan SEM?
- Jika seorang peneliti telah memutuskan untuk menggunakan SEM, apa persyaratan terkait data untuk menggunakan SEM?
Mengapa menggunakan SEM?
SEM adalah pendekatan yang lebih bernuansa dan rumit - dan karenanya kurang dapat diakses - untuk analisis data dibandingkan pendekatan pemodelan linear umum lainnya (misalnya, ANOVA, korelasi, regresi, dan ekstensi mereka, dll.). Apa pun yang dapat Anda pikirkan untuk dilakukan dengan pendekatan itu, Anda dapat melakukannya dengan SEM.
Karena itu, saya pikir para calon pengguna harus terlebih dahulu mengevaluasi dengan kuat mengapa mereka terpaksa menggunakan SEM. Yang pasti, SEM menawarkan beberapa manfaat yang kuat bagi penggunanya, tetapi saya telah meninjau makalah di mana tidak ada manfaat yang digunakan, dan produk akhir adalah bagian analisis data dalam makalah yang tentu saja lebih sulit bagi pembaca biasa untuk memahami . Hanya saja tidak sebanding dengan masalahnya - untuk peneliti, atau pembaca - jika manfaat dari SEM vs pendekatan analisis data lainnya tidak sedang menuai.
Jadi apa yang saya lihat sebagai manfaat utama dari pendekatan SEM? Yang besar menurut saya adalah:
(1) Pemodelan variabel laten : SEM memungkinkan pengguna untuk memeriksa hubungan struktural (varian, kovarian / korelasi, regresi, perbedaan rata-rata kelompok) di antara variabel laten yang tidak teramati, yang pada dasarnya adalah kovarians bersama antara sekelompok variabel (misalnya, item dari kegelisahan ukur yang mungkin digunakan siswa Anda).
Titik penjualan besar untuk menganalisis variabel laten (misalnya, kecemasan laten) vs skor konstruksi yang diamati (misalnya, rata-rata item kecemasan) adalah bahwa variabel laten bebas kesalahan - variabel laten dibentuk dari kovarians bersama, dan kesalahan berteori menjadi kovari tanpa apa pun. Ini berarti peningkatan daya statistik, karena pengguna tidak perlu lagi khawatir tentang pengukuran yang tidak dapat diandalkan, melemahkan efek yang mereka coba modelkan.
Alasan lain, lebih bersahaja, untuk mempertimbangkan menggunakan SEM adalah dalam beberapa kasus itu adalah cara yang lebih konstruk untuk menguji teori kita tentang konstruk. Jika siswa Anda, misalnya, menggunakan tiga ukuran kecemasan yang berbeda, bukankah akan lebih baik untuk memahami penyebab / konsekuensi dari kesamaan ketiga ukuran tersebut - mungkin kecemasan - dalam kerangka SEM, alih-alih mengistimewakan khususnya salah satu ukuran sebagai satu ukuran kecemasan?
(2) Pemodelan beberapa variabel dependen: Bahkan jika seseorang tidak akan menggunakan SEM untuk memodelkan variabel laten, itu masih bisa sangat berguna sebagai kerangka kerja untuk secara bersamaan menganalisis berbagai variabel hasil dalam satu model. Misalnya, mungkin siswa Anda tertarik untuk mengeksplorasi bagaimana prediktor yang sama dikaitkan dengan sejumlah hasil yang relevan secara klinis (misalnya, kecemasan, depresi, kesepian, harga diri, dll.). Mengapa menjalankan empat model terpisah (meningkatkan tingkat kesalahan Tipe I), ketika Anda bisa menjalankan satu model untuk keempat hasil yang Anda minati? Ini juga merupakan alasan untuk menggunakan SEM ketika berhadapan dengan tipe tertentu dari data dependen, di mana banyak, responden dependen dapat menghasilkan respons prediktor dan hasil (misalnya, data diad; lihat Kenny, Kashy, dan Cook, 2006,
(3) Memodelkan asumsi, alih-alih membuatnya : Dengan banyak pendekatan lain untuk analisis data (misalnya, ANOVA, korelasi, regresi), kami membuat satu ton asumsi tentang sifat-sifat data yang kami hadapi - seperti homogenitas dari varian / homoskedastisitas. SEM (biasanya dikombinasikan dengan pendekatan variabel laten) memungkinkan pengguna untuk benar-benar memodelkan parameter varians secara bersamaan di samping sarana dan / atau korelasi / jalur regresif. Ini berarti bahwa pengguna dapat mulai berteori tentang dan menguji hipotesis tentang variabilitas, di samping perbedaan rata-rata / kovariabilitas, alih-alih hanya memperlakukan variabilitas sebagai asumsi yang berkaitan dengan asumsi yang berkaitan setelah itu.
Asumsi lain yang dapat diuji, ketika membandingkan tingkat rata-rata kelompok pada beberapa variabel, adalah apakah variabel itu benar-benar berarti hal yang sama untuk setiap kelompok - disebut sebagai invarian pengukuran dalam literatur SEM (lihat Vandenberg & Lance, 2000, untuk tinjauan proses ini ). Jika demikian, maka perbandingan tingkat rata-rata dari variabel itu valid, tetapi jika kelompok memiliki pemahaman yang sangat berbeda tentang apa sesuatu itu, membandingkan tingkat rata-rata antara kelompok dipertanyakan. Kami membuat asumsi khusus ini secara implisit sepanjang waktu dalam penelitian menggunakan perbandingan kelompok.
Dan kemudian ada asumsi, bahwa ketika Anda rata-rata atau menjumlahkan skor item (misalnya, pada ukuran kecemasan) untuk membuat indeks agregat, bahwa setiap item adalah ukuran yang sama baiknya dari konstruk yang mendasarinya (karena setiap item ditimbang sama rata dalam rata-rata / jumlah). SEM menghilangkan asumsi ini ketika variabel laten digunakan, dengan memperkirakan nilai loading factor yang berbeda (hubungan antara item dan variabel laten) untuk setiap item.
Terakhir, asumsi lain tentang data (misalnya, normalitas), meskipun masih penting untuk SEM, dapat dikelola (misalnya, melalui penggunaan estimator "kuat", lihat Finney & DiStefano, 2008) ketika data gagal memenuhi kriteria tertentu (tingkat kemiringan dan kurtosis rendah).
(4) Menentukan batasan model: Alasan besar terakhir, menurut pendapat saya, untuk mempertimbangkan menggunakan SEM, adalah karena membuatnya sangat mudah untuk menguji hipotesis tertentu yang mungkin Anda miliki tentang model data Anda, dengan memaksa ("membatasi" dalam istilah SEM) jalur tertentu dalam model Anda untuk mengambil nilai-nilai tertentu, dan memeriksa bagaimana hal itu berdampak pada kecocokan model Anda dengan data Anda. Beberapa contoh termasuk: (A) membatasi jalur regresi ke nol, untuk menguji apakah perlu dalam model; (B) yang mengandung jalur regresi berganda sama besarnya (misalnya, apakah kekuatan asosiatif untuk beberapa prediktor kira-kira sama untuk kecemasan dan depresi?); (C) membatasi parameter pengukuran yang diperlukan untuk mengevaluasi invarian pengukuran (dijelaskan di atas); (D) membatasi jalur regresi untuk memiliki kekuatan yang sama antara dua kelompok yang berbeda,
Apa persyaratan terkait data untuk SEM?
Persyaratan terkait data untuk SEM cukup sederhana; Anda memerlukan ukuran sampel yang memadai, dan agar data Anda memenuhi asumsi penduga model yang telah Anda pilih (Maksimum-Kemungkinan adalah tipikal).
Sulit untuk memberikan rekomendasi satu ukuran untuk semua ukuran sampel. Berdasarkan beberapa simulasi langsung, Little (2013) menunjukkan bahwa untuk model yang sangat sederhana, 100-150 pengamatan mungkin cukup, tetapi kebutuhan ukuran sampel akan meningkat ketika model menjadi lebih kompleks, dan / atau sebagai keandalan / validitas dari variabel yang digunakan dalam model berkurang. Jika kompleksitas model menjadi perhatian, Anda dapat mempertimbangkan mem-parsing indikator variabel laten Anda, tetapi tidak semua setuju dengan pendekatan ini (Little, Cunningham, Shahar, & Widaman, 2002). Tapi secara umum, semua sama, sampel yang lebih besar (saya berusaha untuk minimum 200 dalam penelitian saya sendiri) lebih baik.
Sedangkan untuk memenuhi asumsi estimator yang dipilih, biasanya ini cukup mudah untuk dinilai (misalnya, lihat nilai skewness dan kurtosis untuk estimator kemungkinan maksimum). Dan bahkan jika data berangkat dari properti yang diasumsikan, sebuah penelitian dapat mempertimbangkan penggunaan penaksir "kuat" (Finney & DiStefano, 2008), atau penaksir yang mengasumsikan jenis data yang berbeda (misalnya, penaksir kategori, seperti penaksir berbobot paling sedikit secara diagonal). kotak).
Alternatif Untuk SEM untuk Analisis Data?
Jika seorang peneliti tidak akan mengambil keuntungan dari manfaat yang diberikan oleh pendekatan SEM yang telah saya soroti di atas, saya akan merekomendasikan tetap berpegang pada versi analisis yang lebih mudah dan mudah diakses itu (e..g, t -test, ANOVA, analisis korelasi, model regresi [termasuk mediasi, moderasi, dan model proses bersyarat]). Pembaca lebih akrab dengan mereka, dan karenanya akan lebih mudah memahaminya. Tidak ada gunanya membingungkan pembaca dengan hal-hal kecil dari SEM jika pada dasarnya Anda menggunakan SEM dengan efek yang sama dengan pendekatan analitik yang lebih sederhana.
Saran untuk Peneliti Mengingat Penggunaan SEM?
Bagi mereka yang baru mengenal SEM:
- Dapatkan teks SEM pondasi yang komprehensif dan dapat diakses secara tertulis. Saya suka Beaujean (2014), Brown (2015; edisi sebelumnya juga solid), dan Little (2013; pengantar keseluruhan yang baik, meskipun kemudian berfokus secara khusus pada model longitudinal).
- Pelajari cara menggunakan
lavaan
paket untuk R
(Rosseel, 2012). Sintaksnya semudah sintaks SEM, fungsinya cukup luas untuk kebutuhan SEM banyak orang (pasti untuk pemula), dan gratis. Buku Beaujean memberikan pengantar yang bagus untuk SEM dan lavaan
paket.
- Konsultasikan / gunakan CrossValidated dan StacksOverflow secara teratur. Hal-hal yang tidak terduga dapat terjadi ketika memasang model SEM, dan kemungkinannya, banyak hal aneh yang mungkin Anda alami telah dijelaskan dan bermasalah di Stacks.
- Seperti yang ditunjukkan oleh Herik, perhatikan bahwa hanya karena Anda menentukan model yang menyiratkan hubungan sebab-akibat, itu tidak berarti bahwa SEM membantu membangun hubungan sebab-akibat dalam studi cross-sectional / non-eksperimental. Selain itu, sangat layak mempertimbangkan penggunaan SEM untuk menganalisis data dari desain longitudinal dan / atau eksperimental.
Dan bagi mereka yang mulai benar-benar menggunakan SEM:
- Anda akan, pada suatu saat, tergoda untuk menentukan residu yang berkorelasi mau tak mau, dalam upaya untuk meningkatkan kesesuaian model Anda. Jangan. Setidaknya bukan tanpa alasan a priori yang bagus . Lebih sering daripada tidak, sampel yang lebih besar, atau model yang lebih sederhana adalah obatnya.
- Hindari penggunaan metode identifikasi variabel-penanda untuk variabel laten (yaitu, memperbaiki pemuatan faktor pertama ke 1). Ini istimewa bahwa indikator sebagai indikator "standar emas" dari variabel laten Anda, ketika dalam kebanyakan kasus, tidak ada alasan untuk menganggap ini adalah masalahnya. Ketahuilah bahwa ini adalah pengaturan identifikasi default di sebagian besar program.
Referensi
Beaujean, AA (2014). Pemodelan variabel laten menggunakan R: Panduan langkah demi langkah . New York, NY: Routledge.
Brown, TA (2015). Analisis faktor konfirmasi untuk peneliti terapan (edisi ke-2). New York, NY: Guilford Press.
Finney, SJ, & DiStefano, C. (2008). Data non-normal dan kategorikal dalam pemodelan persamaan struktural. Dalam GR Hancock & RD Mueller (Eds.), Pemodelan persamaan struktural: Kursus kedua (hal. 269-314). Penerbitan Era Informasi.
Kenny, DA, Kashy, DA, & Cook, WL (2006). Analisis data diad . New York, NY: Guilford Press.
Little, TD (2013). Pemodelan persamaan struktural longitudinal . New York, NY: Guilford Press.
Little, TD, Cunningham, WA, Shahar, G., & Widaman, KF (2002). Untuk membagi atau tidak membagi: Menjelajahi pertanyaan, menimbang manfaat. Pemodelan Persamaan Struktural , 9 , 151-173.
Rosseel, Y. (2012). lavaan: Paket R untuk pemodelan persamaan struktural. Jurnal Perangkat Lunak Statistik , 48 (2), 1-36.
Vandenberg, RJ, & Lance, CE (2000). Tinjauan dan sintesis literatur invarian pengukuran: Saran, praktik, dan rekomendasi untuk peneliti organisasi. Metode Penelitian Organisasi , 3 , 4-70.