Abaikan jawaban lain di sini. Ini sebenarnya bukan paradoks sama sekali. Masalah aktual yang ada di sini di mana setiap orang tampaknya mengabaikan adalah bahwa Anda salah dalam menentukan probabilitas yang sebenarnya Anda lihat. Sebenarnya ada dua rata-rata dan statistik yang sama sekali berbeda yang berperan di sini yang keduanya memiliki kegunaan dan interpretasi sendiri dalam contoh yang Anda ajukan (pemasaran)!
Pertama ada jumlah rata-rata produk yang dibeli per pelanggan. Jadi rata-rata, satu pelanggan membeli 1,6 item. Tentu saja, seorang pelanggan tidak bisa lain dari 0,6 produk (dengan asumsi itu bukan sesuatu seperti beras atau biji-bijian yang memiliki pengukuran berkelanjutan yang terkait dengannya).
Kedua, ada rata-rata jumlah pelanggan yang membeli produk tertentu. Kedengarannya aneh bukan? Jadi rata-rata suatu produk memiliki 5.33333333 ... pelanggan yang membelinya. Namun ini berbeda. Apa yang kami uraikan di sini bukanlah jumlah produk yang dibeli (hanya ada tiga dari mereka!) Melainkan jumlah orang yang benar-benar membeli produk tersebut.
Pikirkan kedua nilai ini sebagai berikut: Apa yang akan diwakili oleh kedua nilai ini jika hanya ada satu pelanggan atau hanya satu produk? Setelah semua, rata-rata satu titik data tunggal hanya titik data yang diberikan.
Atau lebih baik lagi, pikirkan bagan itu seolah-olah itu memberi Anda jumlah dolar yang dihabiskan untuk membeli produk. Jelas jumlah rata-rata yang dihabiskan oleh pelanggan individu akan jauh lebih sedikit daripada jumlah uang yang dihasilkan rata-rata oleh produk yang dipasok oleh perusahaan besar (atau bahkan hanya bisnis kecil). Saya yakin Anda bisa memikirkan cara-cara yang baik untuk menggunakan kedua nilai tersebut ketika membahas kesejahteraan perusahaan.
Ketika Anda menjelaskan hal ini kepada staf pemasaran, jelaskan kepada mereka seperti yang saya katakan. Itu bukan paradoks. Itu hanya statistik yang sama sekali berbeda. Satu-satunya masalah di sini adalah memperhatikan bahwa sebenarnya ada dua cara berbeda untuk membaca grafik (yaitu jumlah orang yang membeli per produk vs jumlah produk yang dibeli per orang).
tl; hal pertama yang Anda gambarkan adalah jumlah rata-rata yang ingin dihabiskan pelanggan individu untuk membeli produk Anda. Yang kedua adalah permintaan rata-rata untuk produk yang diberikan oleh publik. Saya yakin Anda dapat melihat sekarang mengapa keduanya jelas bukan hal yang sama. Membandingkannya hanya akan memberi Anda informasi sampah.
EDIT
Akan muncul pertanyaan sebenarnya menanyakan tentang uang rata-rata yang dihabiskan oleh pelanggan yang membeli beberapa produk a, b, atau c. Baik. Ini sebenarnya hanya kesalahan dalam perhitungan. Saya tidak akan menyebutnya paradoks. Ini benar-benar hanya kesalahan halus.
Lihatlah kolom Anda. Ada orang yang dibagikan di antara kolom. Mari kita asumsikan Anda melakukan rata-rata tertimbang yang tepat . Anda masih menambahkan orang dua kali. Ini berarti bahwa rata-rata akan berisi orang tambahan dengan nilai lebih dari atau sama dengan 2. Sekarang, apa yang rata-rata Anda? Itu 1,6! Intinya, rata-rata Anda terlihat seperti ini:
∑ni = 0v a l u e O fPe r s o nsaya∗ v a l u e O fPe r s o nsayan
Itu jelas bukan formula yang tepat. Ini adalah rata-rata tertimbang dengan asumsi eksklusivitas timbal balik adalah bagaimana Anda akan menyesuaikan diri untuk mendapatkan rata-rata yang sebenarnya dalam situasi Anda.
∑ni = 0n u m b e r O fPe o p l e B u yi n gsaya∗ a v e r a ge Sp e n t B yPe r s o n B u yi n gsayan
Apa pun cara Anda akan mendapatkan rata-rata kacau. Satu kesalahan adalah mengabaikan kebutuhan untuk rata-rata tertimbang karena satu kategori memiliki "bobot" yang lebih besar dalam hal rata-rata. Ini seperti kepadatan. Satu nilai lebih padat diwakili orang. Masalah lainnya adalah penambahan duplikat yang akan mendistorsi rata-rata. Saya tidak menyebut salah satu dari "paradoks" ini. Begitu saya melihat apa yang Anda lakukan, tampak jelas bagi saya mengapa itu tidak berhasil. Rata-rata tertimbang agak jelas untuk kebutuhannya dan saya pikir sekarang Anda melihat bahwa Anda menambahkan nilai beberapa kali ... yang tidak bisa berfungsi. Anda pada dasarnya mengambil rata-rata kuadrat dari nilainya.