Untuk proyek tugas akhir kami di Ilmu Data, kami mengusulkan berikut-
Berikan Dataset Ulasan Amazon , kami berencana untuk membuat algoritme (yang kira-kira berdasarkan pada Personal PageRank) yang menentukan posisi strategis untuk menempatkan iklan di Amazon. Misalnya, ada jutaan produk di Amazon. Dan dataset memberi Anda gambaran tentang produk apa yang terkait, produk apa yang disatukan, dilihat bersama, dll. (Kami dapat membuat grafik dengan info ini juga dilihat dan juga dibeli) Ini juga memberi Anda ulasan terkait dengan setiap produk lebih dari 14 tahun. Dengan menggunakan semua info ini, kami akan memberi peringkat / memberi peringkat produk di Amazon. Sekarang, Anda adalah vendor di Amazon yang ingin meningkatkan traffic ke halaman produk mereka. Algoritma kami membantu Anda mengidentifikasi posisi strategis dalam grafik tempat Anda dapat menempatkan iklan sehingga Anda dapat memperoleh lalu lintas maksimal.
Sekarang, pertanyaan Profesor kami adalah, bagaimana Anda akan memvalidasi algoritma Anda tanpa pengguna nyata? Kami berkata-
Kami dapat memodelkan sekelompok pengguna tetap. Beberapa pengguna mengikuti
also_bought
danalso_viewed
menautkan ke hop ketiga lebih sering daripada hop pertama atau kelima. Di sana perilaku pengguna terdistribusi secara normal. Beberapa pengguna lain sulit menavigasi melampaui hop pertama. Serangkaian perilaku pengguna ini didistribusikan secara eksponensial.
Kata Profesor kami - Distribusi apa pun yang diikuti pengguna, pengguna menavigasi menggunakan tautan untuk produk serupa. Algoritme peringkat Anda juga mempertimbangkan kesamaan produk b / w 2 dengan produk peringkat. Jadi menggunakan algoritma validasi ini agak cheating
. Hadir dengan beberapa perilaku pengguna lain, sesuatu yang lebih realistis dan ortogonal pada algoritme.
Adakah ide tentang bagaimana memodelkan perilaku pengguna? Saya senang memberikan detail lebih lanjut tentang algo.