Bagaimana cara menghindari tergores?


8

Kami memiliki Database yang dapat ditelusuri (DB), kami membatasi hasilnya hingga 15 per halaman dan hanya 100 hasil yang masih membuat orang mencoba untuk mengikis situs.

Kami melarang situs yang menabraknya dengan cukup cepat. Saya bertanya-tanya apakah ada hal lain yang bisa kita lakukan. Flash membuat hasilnya mungkin?


Pastikan Anda memiliki robots.txt sebuah ... ya aku tahu tidak semua orang kehormatan itu .. tapi beberapa masih melakukan
trent

Jawaban:


6

Anda bisa membuatnya sedikit lebih sulit dengan mengambil catatan melalui AJAX, dan menggunakan ID otentikasi (seperti kunci API) untuk panggilan AJAX.

Tentu saja Anda dapat menyiasatinya dengan membaca ID dan kemudian membuat permintaan AJAX menggunakan itu.

Rendering dengan Flash adalah alternatif seperti yang Anda tunjukkan (meskipun masih belum 100% tidak dapat diuraikan), seperti rendering dalam PDF.


13

Karena jelas ada permintaan untuk basis data Anda, pernahkah Anda berpikir untuk memutarnya dan memberikan apa yang diinginkan para pencakar? Membentuk koneksi bisnis dengan para pencakar dan mendorong penggunaan yang sesuai dengan API?


1
Ya saya suka API
Isaac Waller

+1 Anda bahkan dapat membebankan biaya kecil untuk penggunaan API dan membuat beberapa buchs dari pencakar-berubah-klien
Sander Marechal

Ya, kami menyiapkan penghitung waktu dan mencekal jika halaman terlalu cepat, sejauh menjual informasi itu tampaknya tidak mungkin, di masa lalu mereka menggunakan info untuk meletakkannya di situs lain dan mencari pemasukan klik.
Randin


4

Tidak ada solusi teknologi untuk mencegah individu yang termotivasi dari menggores konten Anda yang dapat diakses publik.

Namun, Anda dapat melindungi secara hukum kekayaan intelektual Anda dengan:

  • Memastikan bahwa situs Anda memiliki hak cipta yang ditandai dengan jelas
  • Memposting Persyaratan Layanan di footer yang jelas-jelas melarang pengikisan
  • Pertimbangkan menyematkan tanda air digital ke semua konten situs Anda. Jangan lupa bahwa teks juga bisa diberi watermark!

2

Bagaimana dengan mengatur otentikasi (dan mungkin captcha), melacak penggunaan, dan membatasi akses ke sejumlah catatan atau pencarian adalah periode waktu tertentu?


1

Anda mungkin akan menemukan bahwa pengikis akan meningkatkan kualitasnya saat Anda menerapkan teknik yang berbeda. Mungkin ada cara untuk menganalisis perilaku pengguna yang mengikis dan menyajikan captcha atau gangguan lainnya? Mungkin Anda dapat membatasi hasil ke jumlah yang lebih kecil untuk jangka waktu tertentu untuk memaksa para pencakar menunggu selama 10 hari. Jika mereka tidak masuk di antara mereka maka anggap mereka scapers?

Apa pun yang Anda lakukan, pastikan untuk menggabungkan teknik Anda untuk memberi mereka umur panjang.


1

Anda perlu mempertimbangkan bahwa para pencakar mungkin tidak menggunakan halaman dan formulir web Anda, mereka mungkin hanya memanggil situs Anda pada tingkat http.

Saya pikir solusi terbaik adalah dengan membuang catchpa setelah alamat ip meminta lebih dari ambang permintaan tertentu.

Anda harus sangat berhati-hati untuk memastikan bahwa Anda tidak mempengaruhi skalabilitas aplikasi Anda untuk pengguna nyata.

Membatasi jumlah data per halaman seperti yang Anda jelaskan dalam pertanyaan hanya akan meningkatkan jumlah permintaan yang akan dilakukan klien terhadap server Anda.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.