Analisis data eksplorasi (EDA) sering mengarah untuk mengeksplorasi "trek" lain yang tidak harus milik set hipotesis awal. Saya menghadapi situasi seperti itu dalam studi dengan ukuran sampel terbatas dan banyak data yang dikumpulkan melalui kuesioner yang berbeda (data sosio-demografi, skala neuropsikologis atau medis - misalnya, fungsi mental atau fisik, tingkat depresi / kecemasan, daftar periksa gejala) ). Kebetulan EDA membantu menyoroti beberapa hubungan tak terduga ("tak terduga" yang berarti bahwa mereka tidak dimasukkan dalam rencana analisis awal) yang diterjemahkan ke dalam pertanyaan / hipotesis tambahan.
Seperti halnya overfitting, pengerukan data atau pengintaian memang mengarah pada hasil yang tidak digeneralisasi. Namun, ketika banyak data tersedia, sangat sulit (bagi peneliti atau dokter) untuk mendalilkan serangkaian hipotesis terbatas.
Saya ingin tahu apakah ada metode, rekomendasi, atau aturan praktis yang diakui yang dapat membantu menggambarkan EDA dalam kasus studi sampel kecil.