Sekelompok file baru dengan nama file unik secara teratur "muncul" 1 pada satu server. (Seperti ratusan GB data baru setiap hari, solusinya harus dapat diukur hingga terabyte. Setiap file berukuran beberapa megabita, hingga beberapa puluh megabita.)
Ada beberapa mesin yang memproses file-file itu. (Puluhan, solusi harus scalable hingga ratusan.) Harus dimungkinkan untuk dengan mudah menambah dan menghapus mesin baru.
Ada server penyimpanan file cadangan tempat setiap file yang masuk harus disalin untuk penyimpanan arsip. Data tidak boleh hilang, semua file yang masuk harus dikirim pada server penyimpanan cadangan.
Setiap myst file yang masuk dikirim ke satu mesin untuk diproses, dan harus disalin ke server penyimpanan cadangan.
Server penerima tidak perlu menyimpan file setelah mengirimnya dalam perjalanan.
Mohon saran solusi yang kuat untuk mendistribusikan file dengan cara, dijelaskan di atas. Solusi tidak boleh berbasis Java. Solusi unix-way lebih disukai.
Server berbasis Ubuntu, berlokasi di pusat data yang sama. Semua hal lain dapat disesuaikan untuk kebutuhan solusi.
1 Perhatikan bahwa saya sengaja menghilangkan informasi tentang cara file diangkut ke sistem file. Alasannya adalah bahwa file-file tersebut sedang dikirim oleh pihak ketiga oleh beberapa warisan yang berbeda berarti saat ini (anehnya, melalui scp, dan melalui ØMQ). Tampaknya lebih mudah untuk memotong antarmuka lintas-cluster di tingkat sistem file, tetapi jika satu atau solusi lain benar-benar akan memerlukan beberapa transportasi khusus - transportasi warisan dapat ditingkatkan ke yang itu.