Jika Anda memiliki dasar-dasar (mengidentifikasi outlier, nilai yang hilang, bobot, pengkodean) tergantung pada topik, ada banyak lagi dalam literatur akademik biasa yang dapat ditemukan. Misalnya dalam penelitian survei (yang merupakan topik di mana banyak hal bisa salah, dan rentan terhadap banyak sumber bias) ada banyak artikel bagus yang bisa ditemukan.
Ketika mempersiapkan regresi crossectional reguler, hal - hal mungkin kurang kompleks. Masalah mungkin ada misalnya bahwa Anda menghapus terlalu banyak 'outlier' dan dengan demikian secara artifisial sesuai dengan model Anda.
Saya juga merekomendasikan Anda selain belajar teknik yang baik, juga menjaga akal sehat. Pastikan Anda menerapkan teknik dengan benar dan tidak secara membabi buta. Adapun diskusi perangkat lunak dalam jawaban lain. Saya pikir SPSS tidak buruk untuk persiapan data (saya juga mendengar hal-hal baik tentang SAS) tergantung pada ukuran dataset Anda. Menu drop-down sangat intuitif.
Tetapi sebagai jawaban langsung untuk pertanyaan Anda, literatur akademik mungkin atau mungkin tidak menjadi sumber yang sangat baik untuk persiapan data Anda tergantung pada topik dan analisis.