Adakah yang punya kebijakan tentang alur kerja untuk analisis data terkait penulisan laporan khusus? Use-case pada dasarnya adalah ini:
Klien memberikan laporan yang menggunakan analisis data, misalnya estimasi populasi dan peta terkait untuk distrik air.
Analis mengunduh beberapa data, mengarsipkan data, dan menyimpan hasilnya (mis. Menambahkan kolom untuk populasi per unit, atau menyusun data berdasarkan batas-batas kabupaten).
Analis menganalisis data yang dibuat dalam (2), mendekati tujuannya, tetapi melihat bahwa membutuhkan lebih banyak data dan kembali ke (1).
Bilas ulangi sampai tabel dan gambar memenuhi QA / QC dan memuaskan klien.
Menulis laporan dengan menggabungkan tabel dan grafik.
Tahun depan, klien yang bahagia kembali dan menginginkan pembaruan. Ini harus sesederhana memperbarui data hulu dengan unduhan baru (mis. Dapatkan izin bangunan dari tahun lalu), dan menekan tombol "RECALCULATE", kecuali spesifikasi berubah.
Saat ini, saya baru saja memulai direktori dan ad-hoc yang terbaik yang saya bisa. Saya ingin pendekatan yang lebih sistematis, jadi saya berharap seseorang telah menemukan ini ... Saya menggunakan campuran spreadsheet, SQL, ARCGIS, R, dan alat Unix.
Terima kasih!
PS:
Di bawah ini adalah Makefile dasar yang memeriksa dependensi pada berbagai set data menengah (w / .RData
suffix) dan skrip ( .R
suffix). Manfaatkan cap waktu untuk memeriksa dependensi, jadi jika Anda touch ss07por.csv
, ia akan melihat bahwa file ini lebih baru dari semua file / target yang bergantung padanya, dan jalankan skrip yang diberikan untuk memperbaruinya. Ini masih dalam proses, termasuk langkah untuk memasukkan ke dalam database SQL, dan langkah untuk bahasa templating seperti sweave. Perhatikan bahwa Make mengandalkan tab dalam sintaksnya, jadi baca manual sebelum memotong dan menempel. Nikmati dan berikan umpan balik!
http://www.gnu.org/software/make/manual/html_node/index.html#Top
R = / home / wsprague / R-2.9.2 / bin / R persondata.RData: ImportData.R ../../DATA/ss07por.csv Functions.R $ R --slave -f ImportData.R persondata.Munged.RData: MungeData.R Fungsi persondata.RData.R $ R --slave -f MungeData.R report.txt: TabulateAndGraph.R persondata.Munged.RData Functions.R $ R --slave -f TabulateAndGraph.R> report.txt