Saya berpikir bahwa sering, kecenderungan untuk merasa seperti Anda telah jatuh ke lubang kelinci dengan analisis eksplorasi adalah karena kehilangan pandangan terhadap pertanyaan substantif yang Anda tanyakan. Saya melakukannya sendiri, kadang-kadang, dan kemudian harus mengingatkan diri saya apa tujuan saya. Misalnya, apakah saya mencoba membangun model tertentu, atau mengevaluasi kecukupan model yang sudah ada? Apakah saya mencari bukti masalah dengan data (yaitu, analisis data forensik)? Atau, apakah ini dalam tahap awal analisis, di mana saya sedang menyelidiki pertanyaan spesifik secara informal (misalnya, apakah ada hubungan antara dua variabel?) Sebelum pindah untuk mengembangkan model formal? Singkatnya, jika Anda menemukan diri Anda membuat plot dan tabel tetapi tidak dapat menyatakan dengan jelas apa tujuan langsung Anda atau mengapa plot / tabel itu relevan, maka Anda tahu Anda
Saya mencoba mendekati analisis data eksplorasi seperti yang saya lakukan menulis, apakah itu menulis program atau menulis artikel. Dalam kedua kasus itu, saya tidak akan memulai tanpa membuat garis besar terlebih dahulu. Garis besar itu dapat berubah (dan sering kali memang demikian), tetapi untuk mulai menulis tanpa itu tidak efisien, dan sering menghasilkan produk akhir yang buruk.
Organisasi WRT, setiap analis harus menemukan alur kerja yang sesuai baginya — melakukannya adalah IMO lebih penting daripada mencoba mengikuti alur kerja orang lain secara kaku (meskipun selalu membantu untuk mendapatkan ide dari apa yang dilakukan orang lain). Jika Anda bekerja secara terprogram (yaitu, menulis kode yang dapat dijalankan untuk menghasilkan / membuat ulang serangkaian hasil) dan memeriksa pekerjaan Anda menjadi git, maka Anda sudah berada jauh di depan banyak orang dalam hal ini. Saya menduga bahwa Anda mungkin hanya perlu menghabiskan waktu mengatur kode Anda, dan untuk itu, saya sarankan mengikuti garis besar Anda. Misalnya, simpan file analisis Anda relatif singkat dan bertarget, sehingga masing-masing menjawab satu pertanyaan spesifik (misalnya, plot diagnostik untuk model regresi tertentu). Atur ini menjadi subdirektori pada satu atau dua level, tergantung pada ukuran dan kompleksitas proyek. Dengan cara ini, proyek menjadi mendokumentasikan diri; tampilan daftar direktori, subdirektori dan file (bersama dengan komentar di bagian atas setiap file), secara teori, harus mereproduksi outline Anda.
Tentu saja, dalam proyek besar, Anda mungkin juga memiliki kode yang melakukan pembersihan dan pengelolaan data, kode yang Anda tulis untuk memperkirakan jenis model tertentu, atau utilitas lain yang Anda tulis, dan ini tidak akan cocok dengan substantif garis besar untuk analisis data Anda, sehingga mereka harus diatur dalam bagian yang berbeda dari folder proyek Anda.
Pembaruan: Setelah memposting ini, saya menyadari bahwa saya tidak secara langsung menjawab pertanyaan Anda tentang "jalan buntu." Jika Anda benar-benar memutuskan bahwa seluruh rangkaian analisis tidak bernilai, maka jika Anda bekerja di git, Anda selalu dapat menghapus file yang sesuai dengan pesan komit seperti "Abaikan garis analisis ini karena tidak produktif." Tidak seperti meremas-remas apa yang telah Anda tulis dan membuangnya di tempat sampah, Anda selalu dapat kembali ke apa yang Anda lakukan nanti, jika diinginkan.
Namun, saya pikir Anda akan menemukan bahwa jika Anda melanjutkan dari garis besar yang telah Anda pikirkan, Anda akan memiliki lebih sedikit yang disebut jalan buntu. Alih-alih, jika Anda menghabiskan waktu menyelidiki pertanyaan yang berharga dan relevan — bahkan jika ini mengarah pada temuan nol atau tidak berubah seperti yang Anda antisipasi — Anda mungkin masih ingin menyimpan catatan tentang apa yang telah Anda lakukan dan hasilnya (pada minimum, sehingga Anda tidak membuat kesalahan dengan mengulanginya nanti). Pindahkan ini ke bagian bawah garis besar Anda, dalam semacam "Lampiran."