Saya memiliki masalah dalam memutuskan bagaimana menyimpan data ini di basis data saya. Adakah saran tentang cara terbaik untuk melakukannya? Saya tidak tahu banyak tentang database, saya bisa menambahkan.
Saya memiliki data yang diformat seperti itu, tetapi alih-alih 4, jumlah kolom kira-kira 240, sehingga setiap tanggal memiliki 240 nilai unik yang terkait dengannya:
Date/Time 200,00 202,50 205,00
2010.11.12 13:34:00 45,8214 43,8512 41,5369
2010.11.12 13:35:00 461,9364 454,2612 435,5222
Juga, baris dikaitkan dengan DataSites.
Pikiran pertama saya adalah memiliki tabel seperti ini: DataID (pk), DataSiteID, ParameterID, Tanggal, Nilai, dengan indeks pada DataSite, Parameter dan Tanggal. ParameterID merujuk ke tabel lain yang menyimpan header kolom input (200,00 202,50 205,00 ...).
Pikiran kedua saya hanyalah memiliki tabel dengan semua kolom 240-aneh. Saya telah menemukan beberapa cara lain, tetapi mereka juga tidak memuaskan.
Masalah yang saya miliki dengan solusi pertama saya (bukan masalah besar, tapi saya tidak suka itu), adalah bahwa Date dan DataSiteID akan diulang untuk semua 240 nilai dalam baris input itu, sehingga menggunakan sedikit ruang ekstra.
Akan ada sekitar 40gb data setahun yang akan datang (dalam format teks di atas), dan data akan dicari oleh DataSite, Parameter dan Tanggal. Jumlah data yang masuk kemungkinan besar akan empat kali lipat dalam setahun atau lebih.
Ada ide bagus? Terima kasih, James
sunting: Ini adalah data deret waktu, dengan kolom yang diukur pada panjang gelombang berbeda. Data akan ingin dianalisis dalam rentang panjang gelombang yang relatif sempit. Mungkin ada tambahan panjang gelombang tambahan di beberapa titik di masa depan.
sunting: Terima kasih atas jawabannya kawan, saya sangat menghargainya :) Saya pikir saya mungkin dapat menemukan waktu untuk menjalankan beberapa percobaan dengan 500 GB atau lebih data uji. Saya akan mengirim kembali dengan kesimpulan apa pun;)