Saya akan mengatakan bahwa DryadLinq adalah hal terdekat yang kita miliki. NET rakyat harus Hadoop. Tetapi itu tergantung untuk apa Anda ingin menggunakan hadoop. Jika Anda mencari sistem file terdistribusi mandiri (DFS) yang dioptimalkan, maka DryadLINQ bukanlah yang Anda cari. Ini memiliki analog ke DFS tetapi Anda harus membangun partisi secara manual dan mendistribusikan setiap partisi.
Yang sedang berkata, jika aspek eksekusi terdistribusi dari Hadoop yang Anda cari daripada DryadLINQ benar-benar luar biasa (dan tidak, saya tidak berafiliasi dengan MS). Selama Anda memiliki pengaturan cluster HPC Microsoft daripada menggunakan DryadLINQ sangat mudah.
Kode yang Anda tulis sebenarnya hanya kode LINQ lurus, kecuali alih-alih mengeksekusi LINQ, IEnumerable<T>
Anda harus mengeksekusinya PartitionedTable<T>
(struktur data terdistribusi yang dibuat sendiri).
Yang benar-benar keren tentang DryadLINQ adalah waktu perputaran yang cepat (coba, uji, sesuaikan, ulangi) saat mengembangkan algoritme. Anda cukup menulis kode LINQ untuk melakukan penghitungan dan DryadLINQ akan menangani seluruh bagian eksekusi terdistribusi. Ini adalah analog paling alami yang pernah saya temui yang membuat kode penulisan untuk pemrosesan terdistribusi seperti menulis kode untuk pemrosesan proses tunggal.