Saya memiliki beberapa ratus pengukuran. Sekarang, saya mempertimbangkan untuk menggunakan beberapa jenis perangkat lunak untuk menghubungkan setiap ukuran dengan setiap ukuran. Ini berarti ada ribuan korelasi. Di antara ini harus ada (secara statistik) ada korelasi yang tinggi, bahkan jika data benar-benar acak (masing-masing ukuran hanya memiliki sekitar 100 titik data).
Ketika saya menemukan korelasi, bagaimana saya memasukkan informasi tentang seberapa keras saya mencari korelasi, ke dalamnya?
Saya tidak berada pada level tinggi dalam statistik, jadi tolong tahan dengan saya.
R
pada mesin ini membutuhkan waktu 18 detik untuk memperoleh 1000 realisasi distribusi permutasi nol dari koefisien korelasi maksimum untuk 300 oleh 100 matriks x
:correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))