Saya adalah pendiri IPinfo , jadi saya pasti dapat menawarkan beberapa detail tentang ini! Tidak ada satu metode tunggal yang kami gunakan, atau sumber data tunggal, untuk menghasilkan basis data geolokasi kami sendiri (atau set data kami yang lain, seperti IP ke perusahaan, atau IP ke operator). Ini adalah campuran dari sekumpulan set data yang berbeda, teknik pemrosesan data, dan pelajaran yang didapat dari melakukan ini selama beberapa tahun sekarang!
Beberapa sumber data dan teknik yang tidak sering disebutkan meliputi:
Umpan langsung dari ISP. Layanan kami menangani sekitar 500 juta permintaan API sehari, dan digunakan di banyak situs web profil tinggi populer. Oleh karena itu ISP diberi insentif untuk menyediakan kami dengan data geolokasi terkini yang akurat sehingga pelanggan mereka mendapatkan pengalaman hebat di web. Kami bekerja secara langsung dengan semakin banyak ISP setiap saat.
Data lokasi GPS. Dimungkinkan untuk mengumpulkan informasi lokasi yang tepat dengan GPS di perangkat seluler. Anda dapat memasangkannya dengan alamat IP dan beberapa kesimpulan topologi jaringan untuk mengetahui lokasi untuk rentang IP yang diberikan hanya beberapa pengukuran.
Pengguna mengirimkan koreksi. Ketika kami salah lokasi (atau belum diperbarui setelah perubahan), kami akan sering dengan cepat mendapatkan umpan balik dari pengguna, dan dapat memperbaiki lokasi secara manual, atau mengubah algoritme kami untuk memastikan lokasinya tepat di jalankan berikutnya jalur pemrosesan data kami.
Untuk set data IP ke perusahaan kami, kami benar-benar mengikis setiap nama domain tunggal setiap bulan, dan referensi silang data yang kami ekstrak di sana dengan informasi kepemilikan IP, catatan rwhois dan banyak lagi. Kami kemudian juga menggunakan data pengikisan domain untuk menunjukkan domain apa yang di-host pada alamat IP apa, dan juga dalam klasifikasi tipe IP kami, bersama dengan banyak sumber data lainnya, untuk menentukan kemungkinan alamat IP yang terutama digunakan sebagai ISP perumahan, bisnis, atau penyedia hosting. Kami juga menganalisis struktur link dari halaman-halaman, dan menunjukkan beberapa data ini pada host.io .