Anda menggunakan Apache Kafka sebagai antrian terdistribusi dan kuat yang dapat menangani data volume tinggi dan memungkinkan Anda meneruskan pesan dari satu titik akhir ke titik akhir lainnya.
Badai bukanlah antrian. Ini adalah sistem yang telah mendistribusikan kemampuan pemrosesan waktu nyata, yang berarti Anda dapat mengeksekusi semua jenis manipulasi pada data waktu nyata secara paralel.
Alur umum dari alat-alat ini (seperti yang saya ketahui) adalah sebagai berikut:
real-time-system -> Kafka -> Storm -> NoSql -> BI (opsional)
Jadi, Anda memiliki aplikasi waktu nyata yang menangani data volume tinggi, mengirimkannya ke antrean Kafka. Storm menarik data dari kafka dan menerapkan beberapa manipulasi yang diperlukan. Pada titik ini Anda biasanya ingin mendapatkan beberapa manfaat dari data ini, jadi Anda dapat mengirimkannya ke beberapa Nosql db untuk penghitungan BI tambahan, atau Anda dapat menanyakan NoSql ini dari sistem lain.