Langsung dari mulut kuda :
Hadoop adalah kerangka kerja untuk menjalankan aplikasi pada kelompok besar yang dibangun dari perangkat keras komoditas. Kerangka kerja Hadoop secara transparan menyediakan aplikasi baik keandalan maupun pergerakan data. Hadoop mengimplementasikan paradigma komputasi bernama Map / Reduce, di mana aplikasi dibagi menjadi banyak fragmen kecil pekerjaan, yang masing-masing dapat dieksekusi atau dieksekusi kembali pada setiap node dalam cluster. Selain itu, ia menyediakan sistem file terdistribusi (HDFS) yang menyimpan data pada node komputasi, menyediakan bandwidth agregat yang sangat tinggi di seluruh cluster. Baik Map / Reduce dan sistem file terdistribusi dirancang sehingga kegagalan node secara otomatis ditangani oleh framework.
Peta / Mengurangi adalah paradigma pemrograman yang dipopulerkan oleh Google di mana dalam tugas dibagi menjadi bagian-bagian kecil dan didistribusikan ke sejumlah besar node untuk diproses (peta), dan hasilnya kemudian dirangkum menjadi jawaban akhir (mengurangi ). Google dan Yahoo menggunakan ini untuk teknologi mesin pencari mereka, antara lain.
Hadoop adalah kerangka kerja umum untuk menerapkan skema pemrosesan semacam ini. Adapun mengapa itu menendang pantat, terutama karena ia menyediakan fitur rapi seperti toleransi kesalahan dan memungkinkan Anda menyatukan hampir semua jenis perangkat keras untuk melakukan pemrosesan. Ini juga berskala sangat baik, asalkan masalah Anda sesuai dengan paradigma.
Anda dapat membaca semua tentang itu di situs web .
Adapun beberapa contoh, Paul memberi beberapa, tapi di sini ada beberapa lagi yang bisa Anda lakukan yang tidak terlalu web-centric:
- Rendering film 3D. Langkah "map" mendistribusikan geometri untuk setiap frame ke node yang berbeda, node me-rendernya, dan frame yang diberikan digabungkan dalam langkah "kurangi".
- Menghitung energi dalam suatu sistem dalam model molekul. Setiap frame dari lintasan sistem didistribusikan ke sebuah simpul dalam langkah "peta". Node menghitung energi untuk setiap frame,
dan kemudian hasilnya dirangkum dalam langkah "mengurangi".
Pada dasarnya model ini bekerja sangat baik untuk masalah yang dapat dipecah menjadi perhitungan diskrit serupa yang sepenuhnya independen, dan dapat direkombinasi untuk menghasilkan hasil akhir.