Saya mencoba menemukan formula, metode, atau model yang akan digunakan untuk menganalisis kemungkinan bahwa peristiwa tertentu mempengaruhi beberapa data longitudinal. Saya mengalami kesulitan mencari tahu apa yang harus dicari di Google.
Berikut ini sebuah contoh skenario:
Image Anda memiliki bisnis yang memiliki rata-rata 100 pelanggan berjalan setiap hari. Suatu hari, Anda memutuskan untuk menambah jumlah pelanggan yang datang ke toko Anda setiap hari, sehingga Anda melakukan aksi gila di luar toko Anda untuk mendapatkan perhatian. Selama minggu depan, Anda melihat rata-rata 125 pelanggan sehari.
Selama beberapa bulan ke depan, Anda kembali memutuskan bahwa Anda ingin mendapatkan lebih banyak bisnis, dan mungkin mempertahankannya sedikit lebih lama, jadi Anda mencoba beberapa hal acak lainnya untuk mendapatkan lebih banyak pelanggan di toko Anda. Sayangnya, Anda bukan pemasar terbaik, dan beberapa taktik Anda memiliki sedikit pengaruh atau tidak, dan yang lain bahkan memiliki dampak negatif.
Metodologi apa yang bisa saya gunakan untuk menentukan probabilitas bahwa setiap peristiwa individu berdampak positif atau negatif terhadap jumlah pelanggan yang datang? Saya menyadari sepenuhnya bahwa korelasi tidak selalu sama dengan penyebab, tetapi metode apa yang dapat saya gunakan untuk menentukan kemungkinan kenaikan atau penurunan perjalanan bisnis harian Anda di klien setelah peristiwa tertentu?
Saya tidak tertarik menganalisis apakah ada atau tidak ada korelasi antara upaya Anda untuk meningkatkan jumlah pengunjung yang masuk, tetapi apakah ada satu peristiwa, terlepas dari yang lainnya, berdampak.
Saya menyadari bahwa contoh ini agak dibuat-buat dan disederhanakan, jadi saya juga akan memberi Anda deskripsi singkat tentang data aktual yang saya gunakan:
Saya berusaha menentukan dampak yang dimiliki agen pemasaran tertentu di situs web klien mereka ketika mereka mempublikasikan konten baru, melakukan kampanye media sosial, dll. Untuk satu agensi tertentu, mereka mungkin memiliki 1 hingga 500 klien. Setiap klien memiliki situs web dengan ukuran mulai dari 5 halaman hingga lebih dari 1 juta. Selama 5 tahun terakhir, masing-masing agensi telah mencatat semua pekerjaan mereka untuk setiap klien, termasuk jenis pekerjaan yang dilakukan, jumlah halaman web di situs web yang dipengaruhi, jumlah jam yang dihabiskan, dll.
Dengan menggunakan data di atas, yang telah saya kumpulkan ke dalam gudang data (ditempatkan di sekelompok skema bintang / kepingan salju), saya perlu menentukan seberapa besar kemungkinan setiap pekerjaan (setiap peristiwa dalam waktu) berdampak pada lalu lintas yang mengenai setiap / semua halaman yang dipengaruhi oleh suatu karya tertentu. Saya telah membuat model untuk 40 jenis konten yang ditemukan di situs web yang menggambarkan pola lalu lintas khas halaman dengan jenis konten yang mungkin dialami dari tanggal peluncuran hingga sekarang. Dinormalisasi relatif terhadap model yang sesuai, saya perlu menentukan jumlah pengunjung naik atau turun tertinggi dan terendah yang diterima sebagai hasil dari karya tertentu.
Sementara saya memiliki pengalaman dengan analisis data dasar (regresi linier dan berganda, korelasi, dll), saya bingung bagaimana cara memecahkan masalah ini. Sedangkan di masa lalu saya biasanya menganalisis data dengan beberapa pengukuran untuk sumbu tertentu (misalnya suhu vs haus vs hewan dan menentukan dampak pada kehausan yang meningkat di seluruh hewan), saya merasa bahwa di atas, saya mencoba menganalisis dampak dari satu peristiwa di beberapa titik waktu untuk dataset longitudinal yang non-linear, tetapi dapat diprediksi (atau setidaknya mampu model). Saya bingung :(
Bantuan, tips, petunjuk, rekomendasi, atau arahan akan sangat membantu dan saya akan sangat berterima kasih!