Saya berpikir bahwa 'kumpulan data' hanya berarti menggabungkan data yang sebelumnya dibagi menjadi beberapa kategori ... pada dasarnya, mengabaikan kategori-kategori dan membuat data menetapkan satu 'kumpulan' raksasa data. Saya kira ini adalah pertanyaan lebih banyak tentang terminologi daripada aplikasi statistik.
Sebagai contoh: Saya ingin membandingkan 2 situs, dan di dalam setiap situs saya memiliki tipe dua tahun (baik dan buruk). Jika saya ingin membandingkan 2 situs 'keseluruhan' (yaitu, mengabaikan jenis tahun), apakah benar untuk mengatakan bahwa saya mengumpulkan data dalam setiap situs? Lebih jauh dari itu, karena beberapa tahun data terdiri dari jenis tahun yang baik dan buruk, apakah benar juga untuk mengatakan bahwa saya mengumpulkan data di antara tahun-tahun untuk mencapai set data 'tahun baik' dan 'tahun buruk' di setiap situs? Terima kasih atas bantuan Anda! Mog