Saya sedang melihat notebook ini , dan saya bingung dengan pernyataan ini:
Ketika kita berbicara tentang normalitas yang kita maksud adalah bahwa data harus terlihat seperti distribusi normal. Ini penting karena beberapa uji statistik mengandalkan ini (misalnya t-statistik).
Saya tidak mengerti mengapa statistik-T membutuhkan data untuk mengikuti distribusi normal.
Memang, Wikipedia mengatakan hal yang sama:
Distribusi-t siswa (atau hanya distribusi-t) adalah setiap anggota keluarga dari distribusi probabilitas berkesinambungan yang muncul ketika memperkirakan rata-rata populasi yang berdistribusi normal
Namun, saya tidak mengerti mengapa asumsi ini diperlukan.
Tidak ada dari rumusnya yang menunjukkan kepada saya bahwa data harus mengikuti distribusi normal:
Saya melihat sedikit definisi, tetapi saya tidak mengerti mengapa kondisi ini diperlukan.