Kami membuat situs web yang akan mengumpulkan informasi lokasi (poin) dari pengguna. Kami sedang mengeksplorasi teknik untuk menjaga privasi lokasi pengguna (mis., Seringkali pengguna akan membagikan alamat rumah mereka, yang sensitif). Salah satu opsi yang muncul dalam pikiran adalah untuk mengaburkan atau "hash" poin sebelum menyimpannya dalam database, menghilangkan kebutuhan untuk menyimpan data sensitif ini sama sekali.
Persyaratan dasar kami adalah, saya percaya:
Diberikan satu titik yang dikaburkan, tidak mungkin untuk menurunkan titik asli dalam (katakanlah) satu kilometer atau lebih, bahkan mengingat semua metadata yang terkait dengan titik tersebut (yaitu, asumsikan seluruh basis data dikompromikan).
Dengan sejumlah besar titik-titik yang dikaburkan yang sesuai dengan titik asal yang sama, masih tidak mungkin untuk mendapatkan titik semula. (Misalnya, teknik mudah adalah menambahkan vektor acak ke titik asli, tetapi jika Anda melakukan ini cukup kali, titik-titik yang dikaburkan akan mengelompok di sekitar titik asli.)
Akan lebih baik jika berbagai properti statistik dipertahankan, meskipun saya tidak tahu properti mana yang penting pada tahap ini. Sebagai contoh, saya lebih suka bahwa titik-titik yang dikaburkan itu tersebar dengan cara "alami" daripada terakumulasi ke dalam kisi-kisi. Namun, privasi lebih penting daripada ini.