Mencari 'Siku' dalam data


8

Subitisasi adalah penghitungan cepat, akurat untuk tampilan dengan angka rendah, dibedakan dari penghitungan dengan non-linearitas yang tajam dalam plot waktu respons. Di bawah ini adalah plot yang representatif, dari Watson, DG, Maylor, EA, & Bruce, LAM (2007). Perhatikan bahwa waktu pencacahan rata-rata untuk tampilan 1-3 meningkat secara linear, tetapi waktu pencacahan rata-rata untuk 4 tidak mengikuti tren linier. Beberapa penelitian menunjukkan bahwa 'batas' subtitle bergantung pada kondisi tugas dan memori kerja peserta.

masukkan deskripsi gambar di sini

Saya mencari cara untuk menguji di mana siku berada, dengan tujuan akhir untuk mengidentifikasi apa batas subtitisasi peserta. Saat ini, ide terbaik saya adalah melakukan sesuatu seperti kontras polinomial berulang. Pada dasarnya, saya akan menguji tren kuadrat di angka 1-3, kemudian di angka 1-4, dll. Saya ingin mengatakan bahwa saya telah melewati batas subtitisasi ketika tren kuadrat menjadi signifikan (menyesuaikan untuk tes berulang).

Itu tentang batas kemampuan statistik saya, jadi saya tidak bisa mengevaluasi ide ini dengan baik. Pikiran?

Terima kasih sebelumnya.

Jawaban:


3

Tergantung pada definisi Anda tentang "siku" ada banyak tes statistik yang Anda inginkan. Dengan seluruh paket R yang didedikasikan untuk topik ini.

Saya pribadi cenderung menghindarinya, karena Anda tidak pernah tahu sebelumnya apa yang akan mereka anggap sebagai "siku" dan apakah pendapat Anda dan pendapat mereka akan sesuai. (tapi ini mungkin dianggap posisi yang ekstrem) Ini juga akan tergantung apakah Anda ingin tahu apakah ada "siku" di lokasi tertentu, atau apakah Anda ingin bertanya apakah ada satu secara umum.

Untuk kasus lokasi tertentu, Anda tentu saja dapat menyesuaikan dengan regresi lokal, membandingkan koefisien dan menyatakan satu siku menurut aturan Anda sendiri tentang perbedaan dalam lereng.

Masalah sebenarnya terjadi pada kasus terakhir. Jika Anda hanya memiliki beberapa poin, Anda dapat mencoba semuanya. Kalau tidak, saya akan cocok dengan sesuatu yang non-parametrik seperti LOESS, menghitung gradien garis secara berkala (dengan kepadatan yang cukup), seperti yang ditunjukkan di sini: /programming/12183137/calculate-min-max- slope-of-loess-fitted-curve-with-r

dan gunakan lagi beberapa aturan yang Anda rasa nyaman untuk menyatakan sesuatu sebagai "siku". Saya melihat "siku" sebagai kasus ketika perubahan gradien fungsi yang cukup besar terjadi pada interval yang cukup pendek. Tentu saja ambang batas untuk aturan di atas adalah masalah selera masing-masing, itulah sebabnya tidak ada tes.

Secara umum, saya menganggap ini akan sangat tidak berguna jika datanya goyah (karena akan ada banyak perubahan dalam gradien).


Saya mohon berbeda: ada banyak tes statistik untuk "siku," asalkan didefinisikan dengan kejelasan yang cukup. Ini adalah contoh dari perubahan-titik atau masalah struktural-perubahan .
whuber

1
Saya mungkin harus ulangi, jawabannya kemudian. Maksud saya persis bahwa intinya adalah dalam definisi "siku". Selain itu, saya cenderung tidak mempercayai penerapan beberapa prosedur perubahan-titik untuk (time-series) data, karena saya tidak pernah tahu berapa perbedaan definisi "siku" dari penulis. Oleh karena itu saya menganjurkan membuat aturan pribadi untuk mengidentifikasi "siku", daripada menggunakan beberapa alat rak. Anda mungkin tidak memiliki tes statistik, tetapi setidaknya jika Anda membuatnya, Anda tahu apa yang dilakukannya dan bagaimana cenderung memberi label pada kurva.
means-to-meaning

+1 Ini poin yang sangat bagus.
whuber

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.