Saya pernah menemukan jenis plot untuk data kategorikal (yaitu, tabel kontingensi) di internet, yang sangat saya sukai, tetapi saya tidak pernah menemukannya lagi, dan saya bahkan tidak tahu apa namanya. Itu pada dasarnya seperti plot saringan, di mana ketinggian baris dan lebar kolom diskalakan relatif terhadap probabilitas marginal. Dengan demikian, setiap kotak diskalakan ke frekuensi relatif yang diharapkan di bawah kemerdekaan. Namun, itu berbeda dari plot saringan dalam hal itu, daripada merencanakan cross-hatching dalam setiap kotak, itu merencanakan titik (seperti di scatterplot) di lokasi yang dipilih secara acak dari seragam bivariat untuk setiap pengamatan. Dengan cara ini, kepadatan titik mencerminkan seberapa baik penghitungan yang diamati cocok dengan penghitungan yang diharapkan. Artinya, jika kepadatannya sama di setiap kotak, model nolnya masuk akal, ) mungkin sangat tidak mungkin di bawah model nol. Karena titik diplot alih-alih penetasan silang, ada korespondensi sederhana dan intuitif antara elemen yang diplot dan jumlah yang diamati, yang tidak selalu benar untuk plot ayakan (lihat di bawah). Selain itu, penempatan titik-titik secara acak memberikan plot rasa 'organik'. Selain itu, warna dapat digunakan untuk menyoroti kotak / sel yang sangat berbeda dari model nol, dan matriks plot dapat digunakan untuk memeriksa hubungan berpasangan antara banyak variabel yang berbeda, sehingga dapat menggabungkan keuntungan dari plot yang sama.
- Adakah yang tahu apa sebutan plot ini?
- Apakah ada paket / fungsi yang akan melakukan ini dengan mudah di R, atau perangkat lunak lain (katakanlah, Mondrian)? Saya tidak dapat menemukan yang seperti itu di vcd . Tentu saja, itu bisa berupa kode yang sulit dari awal, tetapi itu akan menyebalkan.
Berikut ini adalah contoh sederhana dari plot saringan, perhatikan bahwa mudah untuk melihat bagaimana penghitungan yang diharapkan untuk berbagai kategori harus dimainkan di bawah model nol, tetapi sulit untuk merekonsiliasi penetasan silang dengan angka aktual, menghasilkan plot yang tidak cukup mudah dibaca dan mengerikan secara estetika:
B ~B
A 38 4
~A 3 19
Untuk apa nilainya, plot mosaik memiliki masalah yang berlawanan: meskipun lebih mudah untuk melihat sel mana yang memiliki jumlah 'terlalu banyak' atau 'terlalu sedikit' (relatif terhadap model nol), lebih sulit untuk mengenali apa hubungan antara perhitungan yang diharapkan akan terjadi. Secara khusus, lebar kolom diskalakan relatif terhadap probabilitas marjinal, tetapi ketinggian baris tidak, membuat potongan informasi itu hampir mustahil untuk diekstraksi.
dan sekarang untuk sesuatu yang sama sekali berbeda ...
- Adakah yang tahu dari mana konvensi untuk menggunakan biru untuk 'terlalu banyak' dan merah untuk 'terlalu sedikit' berasal? Ini selalu berlawanan dengan intuisi bagi saya. Bagi saya kelihatannya kerapatan sangat tinggi (atau terlalu banyak pengamatan) cocok dengan panas , dan kerapatan rendah cocok dengan dingin , dan bahwa (setidaknya dalam pencahayaan panggung) merah adalah hangat dan biru adalah dingin .
Pembaruan: Jika saya ingat dengan benar, plot yang saya lihat ada di pdf sebuah bab (pengantar atau ch1) dari sebuah buku yang tersedia secara online secara gratis sebagai pemikat pemasaran. Ini adalah versi kasar dari ide yang saya kodekan dari awal:
Bahkan dengan versi kasar ini, saya pikir lebih mudah dibaca daripada plot saringan, dan dalam beberapa hal lebih mudah daripada plot mosaik (misalnya, lebih mudah untuk mengenali apa hubungannya antara frekuensi sel akan berada di bawah independensi). Akan menyenangkan memiliki fungsi yang: a. akan melakukan ini secara otomatis dengan tabel kontingensi, b. dapat digunakan sebagai blok pembangun matriks plot, dan c. akan memiliki fitur bagus yang datang dengan plot di atas (seperti legenda residual standar pada plot mosaik).
shading.points()
untuk melakukan apa yang Anda inginkan, dalam kerangka strucplot yang dikutip di atas dan tersedia sebagai sketsa dalam vcd
paket.
R
fungsinyaassocplot
mendekati apa yang Anda maksud? Jika tidak, saya yakin seorangR
programmer dapat memodifikasi itu ataumosaicplot
melakukan apa yang Anda inginkan.