Itu benar-benar tergantung pada apa yang ingin Anda capai, dan apa yang Anda maksud dengan "Cluster Terdistribusi Terdistribusi." Saya melakukan hal serupa di Uni menggunakan mesin lama dan PVM itulah "Cluster" dalam arti sekelompok mesin bertindak sebagai satu komputer tunggal untuk melakukan pemrosesan paralel - pikirkan cluster Beowulf. Tentu saja, Anda akan memerlukan kode yang ditulis untuk memanfaatkan ini.
Tempat yang baik untuk memulai, akan menentukan apa yang ingin Anda pelajari dengan proyek ini. Saya sarankan membaca artikel wikipedia tentang Komputasi Paralel sebagai permulaan, dan kemudian menyempurnakan kebutuhan Anda berdasarkan apa yang ingin Anda lakukan.
Sistem antrian pekerjaan sederhana (seperti tukang gigi ) mungkin cukup untuk mendapatkan beberapa hasil keren dengan cepat.
Masalah yang saya miliki ketika saya membuat sebuah cluster komputasi paralel, adalah saya tidak ada hubungannya dengan itu, itu hanya pada dasarnya duduk di sana, tetapi itu adalah proyek yang menyenangkan dan saya belajar sedikit. Bagaimanapun, Anda cenderung belajar sedikit dan bersenang-senang pada saat yang sama, terlepas dari apa yang Anda pilih untuk diterapkan.
Sejauh pilihan distribusi, saya akan menggunakan apa yang paling nyaman bagi saya, karena Anda mungkin perlu menginstal sesuatu dari sumber. Setelah Anda merasa nyaman untuk mengatur semuanya, maka Anda dapat mencari menemukan distribusi yang lebih disesuaikan dengan kebutuhan Anda. Tetapi distribusi apa pun harus dilakukan.
Perangkat lunak apa yang mengkonfigurasi cluster? Ini sepenuhnya tergantung pada jenis cluster apa yang Anda buat.
On board vs. FS yang didistribusikan? Sekali lagi, ini tergantung pada apa persyaratan untuk kluster Anda. Apakah setiap node akan meneruskan data bolak-balik di antara node lain? Apakah mereka akan beroperasi sebagai budak dengan tuan tunggal? akankah mereka beroperasi sepenuhnya secara mandiri? Pertanyaan-pertanyaan ini akan mulai menginformasikan pilihan Anda. Dan tentu saja, selalu ada trade off.
Beberapa tautan lain yang mungkin terbukti menarik:
http://hadoop.apache.org/
http://www.csm.ornl.gov/oscar/
https://computing.llnl.gov/tutorials/parallel_comp/
http://www.google.com/Top/Computers/Parallel_Computing/Programming/Environmentments/
http://www.google.com/Top/Computers/Parallel_Computing/Beowulf/