Bagaimana mengubah data ordinal dari kuesioner menjadi data interval yang tepat?

Apakah ada metode langsung untuk mengubah data tingkat ordinal menjadi tingkat interval (seperti halnya untuk melakukannya sebaliknya)? Dan dapat dilakukan di Excel atau SPSS?

Memiliki data, katakan: 10 pertanyaan pada tingkat ordinal (katakan skala 0-5, di mana 0 = "tidak sama sekali", 5 = "sepanjang waktu"), saya ingin mentransformasikannya sehingga mereka dapat diperlakukan sebagaimana mestinya data tingkat interval untuk keperluan pengujian parametrik (distribusi normal, tes non-parametrik keluar dari pertanyaan).

Akan sangat berterima kasih atas jawabannya!

— Gil
sumber

Bagaimana seseorang dapat memiliki nilai 6, 7, 8, 9, 10 pada skala 0-5, atau apakah saya melewatkan sesuatu?

— ttnphns

Apa yang Anda maksud dengan langsung? Mengonversi variabel kategori ke skala metrik bukanlah tugas yang mudah. Ada beberapa model variabel laten (seperti model IRT) yang, dengan asumsi tertentu berlaku, memungkinkan untuk melakukan itu. Cara lain adalah penskalaan optimal. Tetapi untuk ini saya kira Anda harus bersedia melakukan hal-hal dengan R dan mempelajari beberapa statistik canggih seperti model variabel laten atau PCA nonlinier. Apakah itu terdengar oke?

— Momo

Tanggapan ini akan membahas model yang mungkin dari perspektif pengukuran , di mana kita diberi satu set variabel yang saling berhubungan (nyata) yang diamati, atau ukuran, yang varians bersama diasumsikan untuk mengukur konstruksi yang teridentifikasi dengan baik tetapi tidak secara langsung diamati (umumnya, dalam reflektif cara), yang akan dianggap sebagai variabel laten . Jika Anda tidak terbiasa dengan model pengukuran sifat laten, saya akan merekomendasikan dua artikel berikut: Serangan para psikometri , oleh Denny Borsbooom, dan Pemodelan Variabel Laten: Sebuah Survei , oleh Anders Skrondal dan Sophia Rabe-Hesketh. Pertama saya akan membuat sedikit penyimpangan dengan indikator biner sebelum berurusan dengan item dengan beberapa kategori respons.

Salah satu cara untuk mengubah data level ordinal menjadi skala interval adalah dengan menggunakan semacam model Item Response . Contoh terkenal adalah model Rasch , yang memperluas gagasan model uji paralel dari teori tes klasik untuk mengatasi item-item yang diberi skor binermelalui model linear efek-campuran yang digeneralisasi (dengan logit) (dalam beberapa implementasi perangkat lunak 'modern'), di mana probabilitas mendukung suatu item adalah fungsi dari 'kesulitan item' dan 'kemampuan orang' (dengan asumsi tidak ada interaksi antara lokasi seseorang pada sifat laten yang diukur dan lokasi barang pada skala logit yang sama - yang dapat ditangkap melalui parameter diskriminasi item tambahan, atau interaksi dengan karakteristik spesifik perorangan - yang disebut fungsi item diferensial ). Konstruk yang mendasarinya diasumsikan unidimensional, dan logika model Rasch hanya bahwa responden memiliki 'jumlah konstruk' tertentu - mari kita bicara tentang tanggung jawab subjek ('kemampuannya'), $\theta$ $\theta$

$N=766$ $\alpha=0.971$ $[0.967;0.975]$ ). Awalnya, lima kategori respons diusulkan (1 = 'Tidak pernah', 2 = 'Jarang', 3 = 'Kadang-kadang', 4 = 'Sering', dan 5 = 'Selalu') untuk setiap item. Kami di sini hanya akan mempertimbangkan tanggapan biner.

masukkan deskripsi gambar di sini
_{(Di sini, respons terhadap item tipe-Likert telah dikodekan ulang sebagai respons biner (1/2 = 0, 3-5 = 1), dan kami menganggap bahwa setiap item sama-sama diskriminatif lintas individu, karenanya paralelisme antara lereng kurva item (Rasch model).)}

$x$

Untuk barang - barang politis dengan kategori yang dipesan, ada beberapa pilihan: model kredit parsial , model skala peringkat , atau model respons bergradasi , untuk menyebutkan beberapa di antaranya yang sebagian besar digunakan dalam penelitian terapan. Dua yang pertama milik apa yang disebut "keluarga Rasch" dari model IRT dan berbagi sifat-sifat berikut: (a) monotonitas fungsi probabilitas respons (kurva respons item / kategori), (b) kecukupan skor total individu (dengan laten parameter dianggap tetap), (c) kemandirian lokal yang berarti bahwa respons terhadap item bersifat independen, tergantung pada sifat laten, dan (d) tidak adanya fungsi item diferensial artinya, tergantung pada sifat laten, respons tidak tergantung pada variabel spesifik individu eksternal (misalnya, jenis kelamin, usia, etnis, SES).

Memperluas contoh sebelumnya ke kasus di mana lima kategori respons secara efektif diperhitungkan, seorang pasien akan memiliki probabilitas yang lebih tinggi untuk memilih kategori respons 3 hingga 5, dibandingkan dengan seseorang yang diambil sampelnya dari populasi umum, tanpa ada anteseden dari gangguan terkait kecemasan. Dibandingkan dengan pemodelan item dikotomis yang dijelaskan di atas, model-model ini mempertimbangkan kumulatif (misalnya, peluang menjawab 3 vs 2 atau kurang) atau ambang batas kategori yang berdekatan (peluang menjawab 3 vs 2), yang juga dibahas dalam Kategorikal Agresti Analisis data(bab 12). Perbedaan utama antara model-model tersebut di atas terletak pada cara transisi dari satu kategori respons ke yang lain ditangani: model kredit parsial tidak mengasumsikan bahwa perbedaan antara lokasi ambang tertentu dan rata-rata lokasi ambang pada sifat laten adalah sama atau seragam di seluruh item, bertentangan dengan model skala penilaian. Perbedaan halus lainnya di antara model-model tersebut adalah bahwa beberapa di antaranya (seperti respons bertingkat atau model kredit parsial) memungkinkan parameter diskriminasi yang tidak sama di antara item. Lihat Menerapkan pemodelan teori respons item untuk mengevaluasi item kuesioner dan properti skala , oleh Reeve dan Fayers, atau Dasar teori respons item , oleh Frank B. Baker, untuk detail lebih lanjut.

Karena dalam kasus sebelumnya kita membahas interpretasi kurva probabilitas respons untuk item yang dikotomi, mari kita lihat kurva respons item yang berasal dari model respons bertingkat, menyoroti item target yang sama:

masukkan deskripsi gambar di sini
_{(Model respons bertingkat yang tidak dibatasi, memungkinkan untuk diskriminasi yang tidak sama di antara item.)}

Di sini, pengamatan berikut patut dipertimbangkan:

$[2;2.5]$
Ada pergeseran keseluruhan, dari kiri ke kanan, antara item menilai kualitas tidur dan mereka yang menilai kondisi lebih parah, meskipun gangguan tidur tidak jarang terjadi. Ini diharapkan: setelah semua, bahkan orang-orang dalam populasi umum mungkin mengalami kesulitan tidur, terlepas dari keadaan kesehatan mereka, dan orang-orang yang sangat tertekan atau cemas cenderung menunjukkan masalah seperti itu. Namun, 'orang normal' (jika ini memiliki makna) tidak mungkin menunjukkan beberapa tanda-tanda gangguan panik (probabilitas mereka memilih kategori respons tertinggi adalah nol untuk orang-orang yang berada pada kisaran menengah atau lebih dari sifat laten, [ 0; 1]).

$\theta$

Selain dianggap sebagai model pengukuran yang sesungguhnya , apa yang membuat model Rasch menarik adalah bahwa skor penjumlahan, sebagai statistik yang memadai , dapat digunakan sebagai pengganti untuk skor laten. Selain itu, sifat kecukupan siap menyiratkan pemisahan model (orang dan item) parameter (dalam hal item-item politis, orang tidak boleh lupa bahwa semuanya berlaku pada tingkat kategori respons item), maka aditivitas bersamaan.

Sebuah review yang baik dari hirarki Model IRT, dengan implementasi R, tersedia dalam Mair dan Hatzinger ini artikel yang diterbitkan dalam Journal of Software statistik : Diperpanjang Rasch Modeling: Paket erm untuk Penerapan Model IRT di R . Model lain termasuk model log-linear , model non-parametrik, seperti model Mokken , atau model grafis .

Selain R, saya tidak mengetahui implementasi Excel, tetapi beberapa paket statistik diusulkan di utas ini: Bagaimana cara memulai dengan menerapkan teori respons barang dan perangkat lunak apa yang digunakan?

Akhirnya, jika Anda ingin mempelajari hubungan antara serangkaian item dan variabel respons tanpa menggunakan model pengukuran, beberapa bentuk kuantisasi variabel melalui penskalaan optimal juga bisa menarik. Terlepas dari implementasi R yang dibahas dalam utas tersebut, solusi SPSS juga diusulkan pada utas terkait .

Referensi

Pilkonis, P., Choi, S., Reise, S., Stover, A. dan Riley, W. et al. (2011). Item bank untuk mengukur tekanan emosional dari sistem informasi pengukuran hasil yang dilaporkan pasien (PROMIS): Depresi, kecemasan, dan kemarahan . Penilaian , 18 (3), 263–283.
Choi, S., Gibbons, L. dan Crane, P. (2011). lordif: Paket R untuk mendeteksi fungsi item diferensial menggunakan regresi logistik ordinal iteratif hybrid / Teori Item Response dan simulasi monte carlo . Jurnal Perangkat Lunak Statistik , 39 (8).

— chl
sumber

@ Mama terima kasih. Itu penasaran. Saat menjawab (dan mengulangi balasan ini hari ini), saya belum melihat komentar Anda yang bernilai +1 besar. Tolong, silakan edit respons saya di tempat yang Anda inginkan.

— chl

Dalam bukunya Analisis Data Kategorikal Ordinal , Alan Agresti mencakup beberapa. Salah satunya adalah ridits, yang saya diskusikan di blog saya

— Peter Flom - Pasang kembali Monica
sumber

Bisakah Anda menjelaskan ini lebih banyak? Pada pemikiran pertama, sepertinya metode apa pun yang mengklaim secara objektif menerjemahkan data ordinal ke data interval akan menjadi ajaib, karena sepertinya Anda selalu bisa memberikan contoh tandingan yang tidak terlalu patologis yang akan "memecah" metode apa pun, tetapi saya bisa saja hilang. sesuatu yang penting. Tampaknya juga akan membutuhkan beberapa gagasan apriori tentang jarak antara kategori-kategori ordinal - dari mana asalnya?

— Makro

Rumusnya ada di posting blog, dan diskusi lengkap ada di buku Agresti, tetapi pada dasarnya, ia menggunakan data untuk membuat "proporsi kumulatif rata-rata" dan kemudian menggunakannya sebagai skor. Jarak berasal dari proporsi dalam setiap respons, bukan dari apa pun dalam kategori itu sendiri.

— Peter Flom - Reinstate Monica

+1. Ridits mudah dijelaskan karena fraksi kurang + (1/2) sama dengan fraksi. Jadi jika 1, 2, 3, 4, 5 telah mengamati fraksi atau probabilitas 0,2, 0,4, 0,2, 0,1, 0,1, maka ridit 1 adalah 0,1; bahwa dari 2 adalah 0,4, dll. Ridits memperlakukan kategori secara simetris dan lebih kecil kemungkinannya daripada pecahan lebih kecil atau pecahan lebih banyak untuk memasukkan 0 atau 1 sebagai hasilnya, yang seringkali canggung.

— Nick Cox

Nama ridit itu sendiri dimaksudkan dengan sengaja oleh Bross (catatan: referensi diperlukan) dan penjelasan yang seharusnya adalah omong kosong. Nama yang lebih baik adalah fungsi pertengahan distribusi (Parzen 1993) dan fungsi kelas Haberman (1996). Haberman, SJ 1996. Statistik Lanjutan Volume I: Deskripsi Populasi . New York: Springer. Parzen, E. 1993. Ubah plot PP dan fungsi kuantil sampel kontinu. Komunikasi dalam Statistik - Teori dan Metode 22: 3287-3304.

— Nick Cox

Ridits sendiri dapat didorong melalui misalnya fungsi kuantil normal atau Gaussian.

— Nick Cox