tl; dr: Mereka sangat berbeda dalam banyak aspek dan saya tidak bisa berpikir Redshift akan menggantikan Hadoop.
-Fungsi
Anda tidak bisa menjalankan apa pun selain SQL di Redshift. Mungkin yang paling penting, Anda tidak dapat menjalankan semua jenis fungsi kustom di Redshift. Di Hadoop Anda bisa, menggunakan banyak bahasa (Java, Python, Ruby .. sebut saja). Misalnya, NLP di Hadoop mudah, sementara itu lebih atau kurang mustahil di Redshift. Yaitu ada banyak hal yang dapat Anda lakukan di Hadoop tetapi tidak pada Redshift. Ini mungkin perbedaan yang paling penting.
-Kinerja Profil
Query eksekusi pada pergeseran merah dalam banyak kasus secara signifikan lebih efisien dari pada Hadoop. Namun, efisiensi ini berasal dari pengindeksan yang dilakukan ketika data dimuat ke Redshift (Saya menggunakan istilah yang indexing
sangat longgar di sini). Oleh karena itu, sangat bagus jika Anda memuat data Anda sekali dan menjalankan beberapa kueri, tetapi jika Anda ingin mengeksekusi hanya satu kueri misalnya, Anda mungkin benar-benar kehilangan kinerja secara keseluruhan.
-Cost Profile
Solusi mana yang menang dalam biaya tergantung pada situasi (seperti kinerja), tetapi Anda mungkin perlu cukup banyak pertanyaan untuk membuatnya lebih murah daripada Hadoop (lebih khusus Amazon Elastis Peta Mengurangi). Misalnya, jika Anda melakukan OLAP, kemungkinan Redshift lebih murah. Jika Anda melakukan ETL batch harian, Hadoop lebih cenderung keluar lebih murah.
Karena itu, kami telah mengganti sebagian ETL kami yang dilakukan di Hive ke Redshift, dan itu adalah pengalaman yang sangat hebat; sebagian besar untuk kemudahan pengembangan. Mesin Redshift's Query didasarkan pada PostgreSQL dan sangat matang, dibandingkan dengan Hive. Karakteristik ACID-nya memudahkan untuk mempertimbangkannya, dan waktu respons yang lebih cepat memungkinkan lebih banyak pengujian dilakukan. Ini alat yang hebat untuk dimiliki, tetapi itu tidak akan menggantikan Hadoop.
EDIT : Adapun kompleksitas pengaturan, saya bahkan akan mengatakan itu lebih mudah dengan Hadoop jika Anda menggunakan ESR AWS. Alat mereka sangat matang sehingga sangat mudah menjalankan pekerjaan Hadoop Anda. Alat dan mekanisme di sekitar operasi Redshift belum setua itu. Misalnya, Redshift tidak dapat menangani pemuatan tetesan dan karenanya Anda harus membuat sesuatu yang mengubahnya menjadi beban batch, yang dapat menambah kerumitan pada ETL Anda.