Algoritma apa yang bermanfaat yang ada di sana yang bekerja pada aliran data besar dan juga hasilnya cukup kecil dan satu dapat menghitung hasilnya untuk campuran dua aliran dengan entah bagaimana menggabungkan hasil mereka?
Saya dapat menyebutkan beberapa:
- Hal-hal yang jelas seperti jumlah, min, maks, jumlah, top-K dll.
- Perkiraan algoritma aliran yang disebut "berbasis sketsa" untuk histogram, menghitung item berbeda atau menghitung kuantil
Apa yang ada di sana?
(Saya tertarik karena saya sedang menulis proyek hobi untuk memantau sistem terdistribusi yang kegunaannya ditentukan langsung oleh kegunaan dari algoritma tersebut)