Pertanyaan yang ingin saya tanyakan adalah: bagaimana proporsi sampel dalam 1 SD dari rata-rata distribusi normal bervariasi seiring dengan meningkatnya jumlah varian?
(Hampir) semua orang tahu bahwa dalam distribusi normal 1 dimensi, 68% sampel dapat ditemukan dalam 1 standar deviasi rata-rata. Bagaimana dengan dalam dimensi 2, 3, 4, ...? Saya tahu itu berkurang ... tetapi seberapa banyak (tepatnya)? Akan berguna untuk memiliki tabel yang menunjukkan angka untuk 1, 2, 3 ... 10 dimensi, serta 1, 2, 3 ... 10 SD. Adakah yang bisa menunjuk ke meja seperti itu?
Konteks yang lebih sedikit - Saya memiliki sensor yang menyediakan data hingga 128 saluran. Setiap saluran tunduk pada kebisingan listrik (independen). Ketika saya merasakan objek kalibrasi, saya dapat rata-rata jumlah pengukuran yang cukup dan mendapatkan nilai rata-rata di 128 saluran, bersama dengan 128 penyimpangan standar individu.
TETAPI ... ketika datang ke bacaan instan individu, data tidak merespon sebanyak 128 bacaan individu seperti halnya bacaan tunggal dari (hingga) 128-dimensonal vektor kuantitas. Tentu saja ini adalah cara terbaik untuk memperlakukan beberapa bacaan kritis yang kita ambil (biasanya 4-6 dari 128).
Saya ingin merasakan variasi "normal" dan apa yang "outlier" dalam ruang vektor ini. Saya yakin saya telah melihat meja seperti yang saya jelaskan yang akan berlaku untuk situasi seperti ini - adakah yang bisa menunjuk ke satu?