Pertama, ini hanya lelucon dan salah. Google memiliki banyak ahli statistik yang sangat berbakat, ahli pencarian informasi, ahli bahasa, ekonom, beberapa psikolog, dan lainnya. Orang-orang ini menghabiskan banyak waktu mendidik banyak non-statistik tentang perbedaan antara korelasi dan sebab-akibat. Mengingat bahwa ini adalah organisasi besar, mungkin ada kantong, bahkan kantong besar, ketidaktahuan, tetapi pernyataan itu jelas salah. Selain itu, banyak pendidikan yang menghadapi pelanggan, terutama pengiklan.
Jawaban yang lebih dalam: Perbedaannya sangat penting. Lihat saja peringkat hasil pencarian, dan izinkan saya memperluas lebih dari sekadar "korelasi" untuk memasukkan ukuran-ukuran kesamaan, fungsi penilaian, dll. Beberapa halaman diukur menjadi hasil yang baik untuk kueri tertentu. Ini memiliki berbagai fitur prediktor yang penting untuk peringkat mereka. Berbeda dengan halaman-halaman bagus ini yang merupakan hasil yang bagus untuk kueri adalah sekumpulan halaman web yang merupakan halaman yang hasilnya sangat buruk untuk kueri yang sama. Namun, pembuat halaman tersebut menghabiskan banyak upaya untuk membuatnya terlihat seperti halaman yang bagus dari sudut pandang numerik, seperti kecocokan teks, tautan internet, dan lainnya. Namun, hanya karena halaman-halaman ini secara numerik "mirip" dengan halaman yang baik tidak berarti bahwa ini sebenarnya adalah halaman yang baik. Oleh karena itu, Google telah berinvestasi dan akan terus menginvestasikan banyak upaya untuk menentukan fitur apa yang masuk akal membedakan (memisahkan) halaman baik dan buruk.
Ini bukan korelasi dan sebab-akibat, tetapi lebih dalam dari itu. Halaman yang baik untuk permintaan tertentu dapat memetakan ke ruang numerik di mana mereka tampak serupa dan berbeda dari banyak halaman yang tidak relevan atau buruk, tetapi hanya karena hasilnya berada di wilayah yang sama dari ruang fitur tidak menyiratkan mereka berasal dari subset "kualitas tinggi" yang sama dari web.
Jawaban yang lebih sederhana: Perspektif yang sangat sederhana adalah membahas peringkat hasil. Hasil terbaik harus menjadi yang pertama, tetapi hanya karena sesuatu berada di peringkat pertama bukan berarti itu adalah hasil terbaik. Dengan beberapa metrik penilaian, Anda mungkin menemukan bahwa peringkat Google berkorelasi dengan standar emas penilaian kualitas, tetapi itu tidak berarti bahwa peringkat mereka menyiratkan bahwa hasilnya benar-benar dalam urutan ini dalam hal kualitas dan relevansi.
Pembaruan (jawaban ketiga): Seiring waktu, ada aspek lain yang memengaruhi kita semua: itu adalah hasil Google teratas dapat dianggap otoritatif, karena itu adalah hasil teratas di Google. Meskipun analisis tautan (mis. "PageRank" - salah satu metode untuk analisis tautan) adalah upaya untuk mencerminkan keabsahan yang dirasakan, seiring waktu halaman-halaman baru pada suatu topik dapat dengan mudah memperkuat struktur tautan tersebut dengan menautkan ke hasil teratas di Google. Halaman yang lebih baru yang lebih otoritatif memiliki masalah dengan headstart relatif terhadap hasil pertama. Karena Google ingin memberikan halaman yang paling relevan saat ini , berbagai faktor, termasuk apa yang disebut "kaya-kaya" fenomena, muncul karena efek implisit korelasi pada sebab-sebab yang dirasakan.
Pembaruan (jawaban keempat): Saya menyadari (untuk komentar di bawah) bahwa mungkin berguna untuk membaca Allegory of the Cave milik Plato untuk mendapatkan pengertian bagaimana menafsirkan korelasi dan sebab akibat sebagai hasil dari "refleksi / proyeksi" kenyataan & bagaimana kami (atau mesin kami) melihatnya. Korelasi, sangat terbatas pada Korelasi Pearson, terlalu terbatas sebagai interpretasi dari masalah asosiasi kesalahpahaman (lebih luas dari sekadar korelasi) dan sebab-akibat.