Saya khawatir saya mungkin memiliki jawaban yang bernuansa dan mungkin tidak memuaskan bahwa itu adalah pilihan subjektif oleh peneliti atau analis data. Seperti disebutkan di tempat lain di utas ini, tidak cukup hanya mengatakan bahwa data memiliki "struktur bersarang." Agar adil, bagaimanapun, ini adalah berapa banyak buku yang menggambarkan kapan harus menggunakan model bertingkat. Sebagai contoh, saya baru saja menarik buku Joop Hox Multilevel Analysis dari rak buku saya, yang memberikan definisi ini:
Masalah bertingkat menyangkut populasi dengan struktur hirarkis.
Bahkan dalam buku teks yang cukup bagus, definisi awal tampaknya melingkar. Saya pikir ini sebagian karena subjektivitas menentukan kapan harus menggunakan model seperti apa (termasuk model bertingkat).
Buku lain, West, Welch, & Galecki, Mixed Model Linear mengatakan model ini untuk:
variabel hasil di mana residu terdistribusi normal tetapi mungkin tidak independen atau memiliki varian konstan. Desain studi yang mengarah ke set data yang dapat dianalisis dengan tepat menggunakan LMM meliputi (1) studi dengan data cluster, seperti siswa di ruang kelas, atau desain eksperimental dengan blok acak, seperti kumpulan bahan baku untuk proses industri, dan (2) studi longitudinal atau tindakan berulang, di mana subjek diukur berulang kali dari waktu ke waktu atau dalam kondisi yang berbeda.
Model Multilevel dari Finch, Bolin, & Kelley di R juga berbicara tentang melanggar asumsi awal dan residu yang berkorelasi:
Yang sangat penting dalam konteks pemodelan bertingkat adalah asumsi [dalam regresi standar] dari istilah kesalahan yang didistribusikan secara independen untuk pengamatan individu dalam sampel. Asumsi ini pada dasarnya berarti bahwa tidak ada hubungan di antara individu dalam sampel untuk variabel dependen setelah variabel independen dalam analisis diperhitungkan.
Saya percaya bahwa model bertingkat masuk akal ketika ada alasan untuk percaya bahwa pengamatan tidak harus independen satu sama lain. Apa pun "gugus" akun untuk non-kemerdekaan ini dapat dimodelkan.
Contoh nyata adalah anak-anak di ruang kelas - mereka semua berinteraksi satu sama lain, yang mungkin menyebabkan nilai tes mereka menjadi tidak independen. Bagaimana jika satu kelas memiliki seseorang yang mengajukan pertanyaan yang mengarah ke materi yang tercakup dalam kelas yang tidak tercakup dalam kelas lain? Bagaimana jika guru lebih terjaga untuk beberapa kelas daripada yang lain? Dalam hal ini, akan ada beberapa data yang tidak independen; dalam kata-kata bertingkat, kita bisa mengharapkan beberapa varians dalam variabel dependen disebabkan oleh cluster (yaitu, kelas).
Contoh Anda tentang seekor anjing versus seekor gajah tergantung pada variabel minat yang independen dan tergantung, saya kira. Sebagai contoh, katakanlah kita bertanya apakah ada efek kafein pada tingkat aktivitas. Hewan dari seluruh kebun binatang secara acak ditugaskan untuk mendapatkan minuman berkafein atau minuman kontrol.
Jika kita seorang peneliti yang tertarik pada kafein, kita dapat menentukan model bertingkat, karena kita benar-benar peduli tentang efek kafein. Model ini akan ditentukan sebagai:
activity ~ condition + (1+condition|species)
Ini sangat membantu jika ada sejumlah besar spesies yang sedang kami uji hipotesis ini. Namun, seorang peneliti mungkin tertarik pada efek spesifik spesies dari kafein. Dalam hal ini, mereka dapat menentukan spesies sebagai efek tetap:
activity ~ condition + species + condition*species
Ini jelas merupakan masalah jika, katakanlah, 30 spesies, menciptakan desain 2 x 30 yang berat. Namun, Anda bisa menjadi sangat kreatif dengan bagaimana seseorang memodelkan hubungan ini.
Sebagai contoh, beberapa peneliti berpendapat untuk penggunaan pemodelan multilevel yang lebih luas. Gelman, Hill, & Yajima (2012) berpendapat bahwa pemodelan multilevel dapat digunakan sebagai koreksi untuk beberapa perbandingan — bahkan dalam penelitian eksperimental di mana struktur data tidak jelas bersifat hierarkis:
Masalah yang lebih sulit muncul ketika memodelkan beberapa perbandingan yang memiliki lebih banyak struktur. Sebagai contoh, misalkan kita memiliki lima ukuran hasil, tiga jenis perawatan, dan subkelompok yang diklasifikasikan oleh dua jenis kelamin dan empat kelompok ras. Kami tidak ingin memodelkan struktur 2 × 3 × 4 × 5 ini sebagai 120 grup yang dapat ditukar. Bahkan dalam situasi yang lebih kompleks ini, kami pikir pemodelan multilevel harus dan pada akhirnya akan menggantikan prosedur perbandingan multipel klasik.
Masalah dapat dimodelkan dengan berbagai cara, dan dalam kasus yang ambigu, beberapa pendekatan mungkin tampak menarik. Saya pikir tugas kita adalah memilih pendekatan yang masuk akal dan berdasarkan informasi dan melakukannya secara transparan.