"Bagaimana Anda menangani diberi dataset, tetapi tidak ada tujuan yang jelas?"
Ini akan menjadi hal biasa.
Terlepas dari saran di atas, pahamilah bahwa penting untuk memahami tujuan bisnis tempat Anda berada, dan klien langsung Anda. Seringkali Anda perlu memahami masalah khusus yang membuat mereka beralih ke data lebih baik daripada yang mereka lakukan. Sangat umum untuk disajikan dengan data dan tujuan yang tidak jelas dari klien internal atau eksternal Anda - biasanya tugas Anda untuk menyediakan tujuan yang dapat dicapai dengan data dan akan memecahkan masalah bisnis aktual klien. Sejumlah pemikiran lateral akan diperlukan untuk membuat hasil data dan solusi bisnis cocok.
Saya akan meringkas hal di atas sebagai 'mendefinisikan tujuan terlalu penting (dan mungkin terlalu sulit!) Diserahkan kepada klien (sendiri)'.
Dalam konteks pembelajaran mesin, CRISP-DM adalah metodologi yang mencoba untuk memecahkan masalah ini dengan mengulangi melalui loop sehingga pemahaman data tambahan dapat digunakan dalam diskusi dengan klien untuk lebih memahami masalah asli. Jadi, misalnya, mereka mungkin menyatakan tujuan yang tidak jelas, diskusi kedua setelah Anda melakukan EDA akan sedikit mempertajamnya. Ketika nanti Anda menghasilkan model yang berfungsi dengan baik, tetapi tidak pada target yang tepat, Anda akan semakin dekat dengan tujuan bisnis yang sebenarnya.
Dengan kata lain, jangan terlalu terganggu oleh ketidakjelasan tugas. Berharap untuk menemukan vaccuum, dan isi untuk keuntungan Anda.
Ini sedikit pergeseran ke samping, tetapi metodologi six sigma berusaha untuk memecahkan masalah ini dalam konteks yang berbeda dengan sistem DMAIC ('D' singkatan dari 'Define', dalam hal 'suara pelanggan'), jadi itu adalah kemungkinan bahwa beberapa kiat dapat diperoleh dalam sumber daya untuk konteks six sigma (misalnya latihan yang dapat Anda lakukan dengan klien yang membantu mereka mengungkapkan apa yang Anda inginkan dengan lebih jelas)