Baru-baru ini mulai mengajar diri saya sendiri Pembelajaran Mesin dan Analisis Data, saya mendapati diri saya membentur dinding bata pada kebutuhan untuk membuat dan menanyakan set data yang besar. Saya ingin mengambil data yang telah saya kumpulkan dalam kehidupan profesional dan pribadi saya dan menganalisisnya tetapi saya tidak yakin cara terbaik untuk melakukan hal berikut:
Bagaimana saya harus menyimpan data ini? Unggul? SQL ??
Apa cara yang baik bagi pemula untuk mulai mencoba menganalisis data ini? Saya seorang programmer komputer profesional sehingga kerumitannya tidak dalam menulis program tetapi lebih atau kurang spesifik untuk domain analisis data.
EDIT: Permintaan maaf untuk ketidakjelasan saya, ketika Anda pertama kali mulai belajar tentang sesuatu itu sulit untuk mengetahui apa yang Anda tidak tahu, ya tahu? ;)
Karena itu, tujuan saya adalah menerapkan ini pada dua topik utama:
Metrik tim perangkat lunak (pikirkan kecepatan Agile, risiko kuantifikasi, kemungkinan iterasi yang berhasil diselesaikan dengan sejumlah x poin cerita)
Pembelajaran mesin (mis. Pengecualian sistem telah terjadi dalam satu set modul apa kemungkinan modul akan melempar pengecualian di lapangan, berapa biayanya, berapa data yang dapat saya ceritakan tentang modul-modul kunci untuk ditingkatkan yang akan diperoleh saya yang terbaik untuk uang saya, memprediksi bagian sistem yang ingin digunakan pengguna selanjutnya untuk mulai memuat data, dll).