Konteks:
Sementara saya telah memperoleh satu set heuristik tentang cara memplot secara efektif hubungan antara dua variabel numerik. Saya membayangkan sebagian besar orang yang bekerja dengan data akan memiliki seperangkat aturan yang sama.
Contoh aturan tersebut mungkin:
- Jika salah satu variabel condong positif, pertimbangkan untuk memplot sumbu itu pada skala log.
- Jika ada banyak titik data (misalnya, n> 1000), adopsi strategi yang berbeda seperti menggunakan beberapa bentuk transparansi parsial, atau pengambilan sampel data;
- Jika salah satu variabel mengambil sejumlah kategori diskrit, pertimbangkan untuk menggunakan jitter atau plot bunga matahari;
- Jika ada tiga atau lebih variabel, pertimbangkan untuk menggunakan matriks sebar;
- Menyesuaikan beberapa bentuk garis tren seringkali berguna;
- Sesuaikan ukuran karakter plot dengan ukuran sampel (untuk n lebih besar, gunakan karakter plot yang lebih kecil);
- dan seterusnya.
Pertanyaan:
Saya ingin dapat merujuk siswa ke halaman web atau situs yang menjelaskan ini dan trik lain untuk secara efektif merencanakan hubungan antara dua variabel numerik, mungkin dengan contoh.
- Apakah ada halaman atau situs di internet yang melakukan pekerjaan dengan baik ini?