Apakah mungkin untuk memahami model pareto / nbd secara konseptual?


12

Saya belajar menggunakan paket BTYD yang menggunakan model Pareto / NBD untuk memprediksi kapan pelanggan akan kembali. Namun, semua literatur pada model ini penuh dengan matematika dan tampaknya tidak ada penjelasan yang sederhana / konseptual tentang cara kerja model ini. Apakah mungkin untuk memahami model Pareto / NBD untuk non-ahli matematika? Saya telah membaca makalah terkenal ini oleh Fader . Model Pareto / NBD membuat asumsi berikut:

saya. Saat aktif, jumlah transaksi yang dilakukan oleh pelanggan dalam periode waktu t panjang didistribusikan Poisson dengan tingkat transaksi λ.

ii. Heterogenitas dalam tingkat transaksi antar pelanggan mengikuti distribusi gamma dengan parameter bentuk r dan parameter skala α.

aku aku aku. Setiap pelanggan memiliki "seumur hidup" panjang yang tidak teramati τ. Titik di mana pelanggan menjadi tidak aktif didistribusikan eksponensial dengan tingkat putus sekolah μ.

iv) Heterogenitas pada tingkat putus sekolah antar pelanggan mengikuti distribusi gamma dengan parameter bentuk s dan parameter skala β.

v. Tingkat transaksi λ dan tingkat putus sekolah μ bervariasi secara independen di seluruh pelanggan. "

Saya tidak mengerti (intuisi di balik) alasan asumsi (ii), (iii) dan (iv). Mengapa hanya distribusi ini, mengapa tidak yang lain?

Asumsi model BG / NBD adalah:

i.) Saat aktif, jumlah transaksi yang dilakukan oleh pelanggan mengikuti proses Poisson dengan kurs transaksi λ. Ini sama dengan mengasumsikan bahwa waktu antara transaksi didistribusikan eksponensial dengan tingkat transaksi λ

ii) Heterogenitas dalam λ mengikuti distribusi gamma

iii) Setelah transaksi apa pun, pelanggan menjadi tidak aktif dengan probabilitas p. Oleh karena itu titik di mana pelanggan "drop out" didistribusikan di seluruh transaksi sesuai dengan distribusi geometris (bergeser) dengan pmf

iv) Heterogenitas dalam p mengikuti distribusi beta

Rasionalitas (intuitif) asumsi (ii), (iii) dan (iv) sama sekali tidak jelas.

Saya akan berterima kasih atas bantuannya. Terima kasih.


Bisakah Anda menambahkan beberapa referensi ke literatur yang menurut Anda sulit?
kjetil b halvorsen

Saya telah menjelaskan di mana hal-hal tidak jelas. Saya tahu tidak mudah untuk membawa intuisi untuk bermain, tetapi jika itu memungkinkan, itu akan sangat membantu. Terima kasih.
user3282777

Jawaban:


14

Bayangkan Anda adalah manajer toko bunga yang baru ditunjuk. Anda memiliki catatan pelanggan tahun lalu - frekuensi berbelanja dan berapa lama sejak kunjungan terakhir mereka. Anda ingin tahu berapa banyak bisnis yang kemungkinan besar dibawa oleh pelanggan terdaftar tahun ini. Ada beberapa hal yang perlu dipertimbangkan:

[asumsi (ii)] Pelanggan memiliki kebiasaan berbelanja yang berbeda.

Beberapa orang suka memiliki bunga segar sepanjang waktu, sementara yang lain hanya oleh mereka pada acara-acara khusus. Lebih masuk akal untuk memiliki distribusi untuk tingkat transaksi , daripada mengasumsikan bahwa satu menjelaskan perilaku semua orang.λλλ

Distribusi perlu memiliki beberapa parameter (Anda tidak harus memiliki banyak data), agar cukup fleksibel (Anda mungkin bukan guru wirausaha yang suka membaca pikiran dan tidak tahu semua tentang kebiasaan belanja), dan untuk mengambil nilai dalam bilangan real positif. Distribusi Gamma mencentang semua kotak itu, dan dipelajari dengan baik dan relatif mudah digunakan. Ini sering digunakan sebagai prior untuk parameter positif dalam pengaturan yang berbeda.

[asumsi (iii)] Anda mungkin telah kehilangan beberapa pelanggan dalam daftar.

Jika Andrea telah membeli bunga sebulan sekali setiap bulan di tahun lalu, itu taruhan yang cukup aman dia akan kembali tahun ini. Jika Ben biasa membeli bunga setiap minggu, tetapi dia belum ada selama berbulan-bulan, maka mungkin dia menemukan toko bunga yang berbeda. Dalam membuat rencana bisnis di masa depan, Anda mungkin ingin mengandalkan Andrea tetapi tidak pada Ben.

Pelanggan tidak akan memberi tahu Anda ketika mereka sudah pindah, di mana asumsi "seumur hidup yang tidak teramati" muncul untuk kedua model. Bayangkan pelanggan ketiga, Cary. Model Pareto / NBD dan BG / NBD memberi Anda dua cara berbeda untuk berpikir tentang Cary yang keluar dari toko untuk selamanya.

Untuk kasus Pareto / NBD, bayangkan bahwa pada suatu saat, ada kemungkinan kecil bahwa Cary akan menemukan toko yang lebih baik daripada milik Anda. Risiko infinitesimal konstan ini memberi Anda masa hidup yang eksponensial - dan semakin lama sejak kunjungan terakhir Cary, semakin lama dia terpapar ke toko bunga (berpotensi lebih baik) lainnya.

Kasus BG / NBD sedikit lebih dibuat-buat. Setiap kali Cary tiba di toko Anda, ia berkomitmen untuk membeli beberapa bunga. Saat browsing, dia akan mempertimbangkan perubahan harga, kualitas, dan variasi sejak kunjungan terakhirnya, dan itu pada akhirnya akan membuatnya memutuskan apakah akan kembali lagi lain kali, atau mencari toko lain. Jadi, daripada terus-menerus dalam risiko, Cary memiliki beberapa probabilitas p hanya memutuskan untuk pergi setelah setiap pembelian.

[asumsi (iv)] Tidak semua pelanggan memiliki komitmen yang sama terhadap toko Anda.

Beberapa pelanggan adalah pelanggan tetap, dan hanya kematian - atau kenaikan harga yang tajam - yang akan memaksa mereka untuk pergi. Orang lain mungkin ingin menjelajahi, dan dengan senang hati meninggalkan Anda demi toko bunga hipster baru di seberang jalan. Daripada satu tingkat drop-out untuk semua pelanggan, lebih masuk akal untuk memiliki distribusi tingkat drop-out (atau probabilitas dalam kasus BG / NBD).

Ini sangat sesuai dengan kebiasaan belanja. Kami mengejar distribusi yang fleksibel dan mapan dengan beberapa parameter. Dalam kasus Pareto / NBD kita menggunakan Gamma, karena laju adalah dalam bilangan real positif. Dalam kasus BG / NBD kami menggunakan Beta, yang merupakan standar sebelum untuk parameter dalam .( 0 ; 1 )μ(0;1)

Saya harap ini membantu. Lihatlah makalah aslinya (Schmittlein et al., 1987) jika Anda belum melakukannya - mereka melewati beberapa intuisi di sana.


Terima kasih atas kerja keras dan penjelasan yang jelas. Alasan untuk menggunakan distribusi Gamma adalah karena relatif mudah untuk dikerjakan dan sering digunakan sebagai prior untuk parameter positif dalam pengaturan yang berbeda. Sementara bentuk sebagian besar distribusi gamma (dengan nilai parameter berbeda) mudah dipahami, tetapi untuk mencocokkan 'Heterogenitas dalam tingkat transaksi di antara pelanggan' dengan distribusi gamma yang hampir turun secara eksponensial (untuk k = 1, theta = 2 seperti pada grafik Wikipedia [ di sini] en.wikipedia.org/wiki/Gamma_distribution ) sedikit sulit untuk dipahami. Apakah kita mengecualikan perilaku seperti itu?
user3282777

1
Perkiraan Anda untuk parameter Gamma akan tergantung pada data yang Anda gunakan. Intinya adalah bahwa distribusi Gamma dapat memiliki bentuk yang sangat berbeda berdasarkan hanya pada dua parameter, dan Anda dapat membiarkan data berbicara sendiri, tanpa memaksakan asumsi yang terlalu ketat (kurang lebih).
Lyuba B.
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.