Seseorang telah mengkloning blog WordPress saya, bagaimana saya mencegahnya dari menyakiti SEO?

Blog WordPress saya sepenuhnya dikloning. Situs klon itu memperbarui secara real time dengan blog saya. Saya terkejut bahwa seseorang benar-benar dapat melakukan itu.

Apa yang harus saya lakukan untuk menghentikan dampak berbahaya pada peringkat mesin pencari saya? Apakah ada cara untuk memberi tahu Google agar tidak mengindeks situs itu?

wordpress scraper-sites

— Tanvir Hasan
sumber

Saya melihat ini sekarang tampaknya telah "diperbaiki" - situs yang dikloning tidak lagi "kloning". Bagaimana Anda mencapai ini pada akhirnya?

— MrWhite

@ w3d Setelah dua minggu dan beberapa percakapan dengan Amazon Hosting, mereka memutuskan untuk menutup situs kloning itu. Terimakasih semuanya.

— Tanvir Hasan

perhatikan bahwa dmca.com dan google.com/webmasters/tools/dmca-dashboard berbeda ketika mencari untuk mengklaim pelanggaran.

— Menampilkan Gambar

Jawaban:

Mereka hanya memuat situs Anda melalui skrip sisi server. Yang perlu Anda lakukan adalah memblokir alamat IP server mereka melalui .htaccess. Cukup buka log akses server Anda, buka halaman yang dikloning di situs mereka, lalu lihat log Anda untuk entri baru dan Anda akan memiliki alamat IP mereka.

Juga tidak ada salahnya untuk mengirimkan permintaan DMCA ke Google, tetapi ini tidak akan benar-benar diperlukan karena konten tersebut akan langsung hilang begitu Anda memblokir alamat IP mereka.

— John Conde
sumber

Saya akan menggandakan saran untuk membuat permintaan DMCA ke Google. Kami melihat berbagai bentuk ini akhir-akhir ini dan saya tidak yakin apa hasilnya. Namun, saya sarankan untuk tidak memblokirnya untuk sementara waktu sementara Google melakukan hal itu - maka saya akan memblokirnya - tetapi Anda mungkin tidak harus melakukannya ketika Google membatalkan daftar mereka. Saya hanya menyarankan bahwa jika Anda mengajukan keluhan DMCA dengan Google, beri mereka waktu untuk menyelidiki sebelum memblokir. Kalau tidak, segera blokir mereka.

— closetnoc

Hai John Conde, saya telah mencoba untuk memblokir memblokir alamat ip mereka melalui file .htaccess menggunakan kode ini "" perintah Order Deny, Izinkan Deny dari [alamat IP itu] kode yang tepat untuk memblokir ip itu?

— Tanvir Hasan

@TanvirHasan Itu adalah ide yang tepat, asalkan Anda memiliki alamat IP yang benar. Apakah alamat IP itu masih muncul di log akses Anda ketika Anda mengunjungi "situs kloning"?

— MrWhite

Penyedia hosting saya memberikan perintah itu pada file .htaccess dan merekalah yang mendapatkan alamat ip itu dari log. Tapi itu tidak berhasil.

— Tanvir Hasan

Apakah ini pernah diselesaikan ??

— closetnoc

(Selain jawaban @ John.)

Apakah ada cara untuk memberi tahu Google agar tidak mengindeks situs itu?

Agak penasaran bahwa sementara mereka tampaknya telah mengkloning segalanya (termasuk peta situs XML Anda ^{* 1} ), mereka belum mengkloning file robots.txt Anda. Bahkan, robots.txt pada yang situs aktif blok merangkak dari segala sesuatu! Jadi sepertinya tidak ada yang bisa dilakukan dalam hal ini. Melakukan pencarian situs di bahwa domain kembali hanya domain telanjang dan pemberitahuan yang menyatakan bahwa yang diblokir oleh robots.txt.

(Agak penasaran apa niat mereka dalam melakukan ini? Anda mungkin bisa berasumsi bahwa mereka melakukan kesalahan dengan robot.txt - dan mungkin begitu - tetapi ini lebih seperti pengecualian yang disengaja bagi saya?)

~~Selain itu, sementara peta situs XML Anda dikloning, mereka tidak memperbarui URL di dalamnya (seperti yang mereka lakukan di halaman situs utama), jadi mereka masih menunjuk kembali ke situs Anda.~~

^{* 1} Mengenai peta situs XML. Di situs Anda "sitemap.xml" sebenarnya merupakan pengalihan ke "sitemap_index.xml" dan situs yang dikloning sebenarnya telah mengkloning pengalihan ... yang mengarahkan kembali ke situs Anda! (Tentunya kesalahan di pihak mereka.) "Sitemap_index.xml" hanyalah sebuah indeks, yang terhubung ke 4 sitemaps lainnya. Jika salah satu dari peta situs aktual ini diminta langsung di situs yang dikloning maka mereka akan dikloning dengan benar dan URL diperbarui. Namun, saya akan mengatakan bahwa peta situs ini tidak mungkin ditemukan di situs yang dikloning karena pengalihan awal "sitemap.xml". (?) Meskipun jika mereka mengirimkan "sitemap_index.xml" secara langsung maka itu jelas akan mengatasi redirect.

— TuanWhite
sumber

Saya membuat permintaan ke sitemap hanya beberapa menit yang lalu dan ada 301 redirect dari situs spam ke situs asli.

— closetnoc

@closetnoc Ah ya! Saya melewatkan itu sebelumnya. "sitemap.xml" sebenarnya merupakan pengalihan di situs asli juga ... itu diarahkan ke "sitemap_index.xml". Situs spam tampaknya mengkloning pengalihan ini yang mengirim pengguna kembali ke situs asli! Jika Anda meminta salah satu dari 4 peta situs yang tercantum dalam "sitemap_index.xml" secara langsung di situs spam maka situs spam tersebut mengkloning mereka dengan benar, namun, karena pengalihan awal, saya kira mereka akan sulit ditemukan, kecuali mereka tahu untuk mengirim "sitemap_index.xml" bukan "sitemap.xml". Saya sudah memperbarui jawabannya. Terima kasih.

— MrWhite

Jika situs menghasilkan backlink kepada Anda, penting untuk menggunakan alat Google Disavow, jika tidak algoritma akan bekerja melawan Anda.

https://www.google.com/webmasters/tools/disavow-links-main

buat file .txt dan tambahkan:

domain:thedamnsitethatcloned.com

kemudian unggah ke Google melalui Alat Webmaster.

Inilah langkah-langkah tepat yang akan saya ambil untuk mengatasi masalah ini. Saya tahu bahwa banyak webmaster menghadapi masalah ini. Saya pernah mengalami masalah ini sebelumnya dan sepertinya tidak ada jawaban langsung di Google (ironisnya) (itulah sebabnya saya ingin membantu). Matt Cutts adalah pria yang seharusnya Anda dengarkan tentang masalah ini, tetapi mendengarkannya seperti mencoba memenangkan permainan catur melawan superkomputer di dalam rumah yang terbakar (tidak ada bantuan yang ditemukan).

Potongan pendek:

Daftarkan pada DMCA dan letakkan lencana di situs web Anda.
Kumpulkan semua konten yang disalin dengan menempelkan 60 kata pertama dari situs web Anda ke Google dan kirimkan VIA https://www.google.com/webmasters/tools/dmca-dashboard Permintaan DMCA hanya akan menerima permalinks.
Tolak SETIAP situs yang telah menyalin konten yang menghubungkan kembali ke Anda. Lakukan ini di setiap halaman situs web Anda.

Jawaban pertama saya adalah menolak domain, tetapi saya lupa menyebutkan bahwa Anda harus menolak:

www. DAN
bukan www.

(Google menghitungnya sebagai dua domain terpisah).

— John
sumber