Saya memiliki dua populasi, Satu dengan N = 38.704 (jumlah pengamatan) dan lainnya dengan N = 1.313.662. Set data ini memiliki ~ 25 variabel, semuanya bersambungan. Saya mengambil rata-rata dari setiap set data dan menghitung statistik uji menggunakan rumus
t = rata-rata perbedaan / kesalahan std
Masalahnya adalah tingkat kebebasan. Dengan rumus df = N1 + N2-2 kita akan memiliki lebih banyak kebebasan daripada yang bisa ditangani tabel. Ada saran tentang ini? Cara memeriksa statistik t di sini. Saya tahu bahwa uji-t digunakan untuk menangani sampel tetapi bagaimana jika kita menerapkan ini pada sampel besar.