Catatan : Jawaban ini semakin usang.
Kontributor terbesar untuk koleksi web Internet Archive adalah Alexa Internet. Materi yang dirayapi Alexa untuk keperluannya telah disumbangkan ke IA beberapa bulan kemudian. Menambahkan aturan pelarangan yang disebutkan dalam pertanyaan tidak memengaruhi perayapan tersebut, tetapi Wayback akan 'secara surut' menghormati mereka (menolak akses, materi masih akan ada di arsip - Anda harus mengecualikan robot Alexa jika Anda benar-benar ingin menyimpan materi Anda di luar Arsip Internet).
Mungkin ada cara untuk mempengaruhi perayapan Alexa, tapi saya tidak terbiasa dengan itu.
Sejak IA mengembangkan perayapnya sendiri (Heritrix), mereka telah mulai melakukan perayapan sendiri, tetapi perayapan tersebut cenderung menjadi perayapan yang ditargetkan (mereka melakukan perayapan pemilihan untuk Library of Congress dan telah melakukan perayapan nasional untuk Perancis dan Australia dll.). Mereka tidak terlibat dalam jenis perayapan skala dunia berkelanjutan yang dilakukan Google dan Alexa. Perayapan terbesar IA adalah proyek khusus untuk merayapi 2 miliar halaman.
Karena perayapan ini dioperasikan pada jadwal yang berasal dari faktor spesifik proyek, Anda tidak dapat memengaruhi seberapa sering mereka mengunjungi situs Anda atau jika mereka mengunjungi situs Anda.
Satu-satunya cara untuk secara langsung mempengaruhi bagaimana dan kapan IA menjelajah situs Anda adalah dengan menggunakan layanan Archive-It mereka. Layanan itu memungkinkan Anda menentukan penjelajahan khusus. Data yang dihasilkan akan (akhirnya) dimasukkan ke dalam koleksi web IA. Namun ini adalah layanan berlangganan berbayar .