Konteks: Menanggapi pertanyaan sebelumnya tentang penelitian yang dapat direproduksi, Jake menulis
Satu masalah yang kami temukan saat membuat arsip JASA kami adalah bahwa versi dan standar paket CRAN berubah. Jadi, dalam arsip itu, kami juga menyertakan versi paket yang kami gunakan. Sistem berbasis sketsa mungkin akan rusak ketika orang mengubah paket mereka (tidak yakin bagaimana memasukkan paket tambahan dalam paket yang merupakan Kompendium).
Akhirnya, saya bertanya-tanya tentang apa yang harus dilakukan ketika R itu sendiri berubah. Adakah cara untuk menghasilkan, katakanlah, mesin virtual yang mereproduksi seluruh lingkungan komputasi yang digunakan untuk kertas sehingga mesin virtual itu tidak besar?
Pertanyaan:
- Apa strategi yang baik untuk memastikan bahwa analisis data yang dapat direproduksi dapat direproduksi di masa mendatang (katakanlah, lima, sepuluh, atau dua puluh tahun setelah publikasi)?
- Secara khusus, apa strategi yang baik untuk memaksimalkan reproduktifitas berkelanjutan saat menggunakan Sweave dan R?
Ini tampaknya terkait dengan masalah memastikan bahwa proyek analisis data yang dapat direproduksi akan berjalan pada mesin orang lain dengan standar, paket, dan lain-lain yang sedikit berbeda.