Saya seorang R
programmer bahasa. Saya juga berada dalam kelompok orang yang dianggap sebagai Ilmuwan Data tetapi berasal dari disiplin akademis selain CS.
Ini berfungsi dengan baik dalam peran saya sebagai Data Scientist, namun, dengan memulai karir saya R
dan hanya memiliki pengetahuan dasar tentang bahasa scripting / web lain, saya merasa agak tidak memadai dalam 2 bidang utama:
- Kurangnya pengetahuan yang kuat tentang teori pemrograman.
- Kurangnya tingkat keterampilan yang kompetitif dalam bahasa yang lebih cepat dan lebih banyak digunakan seperti
C
,C++
danJava
, yang dapat digunakan untuk meningkatkan kecepatan pipa dan perhitungan Big Data serta untuk membuat DS / produk data yang dapat lebih mudah dikembangkan menjadi lebih cepat skrip back-end atau aplikasi mandiri.
Solusinya tentu saja sederhana - pergi belajar tentang pemrograman, yang telah saya lakukan dengan mendaftar di beberapa kelas (saat ini pemrograman C).
Namun, sekarang saya mulai mengatasi masalah # 1 dan # 2 di atas, saya bertanya pada diri sendiri " Seberapa layakkah bahasa seperti C
dan C++
untuk Ilmu Data? ".
Misalnya, saya dapat memindahkan data dengan sangat cepat dan berinteraksi dengan pengguna dengan baik, tetapi bagaimana dengan regresi tingkat lanjut, Pembelajaran Mesin, penambangan teks, dan operasi statistik lainnya yang lebih canggih?
Begitu. dapat C
melakukan pekerjaan - alat apa yang tersedia untuk statistik lanjutan, ML, AI, dan bidang Ilmu Data lainnya? Atau haruskah saya kehilangan sebagian besar efisiensi yang diperoleh dengan pemrograman C
dengan memanggil R
skrip atau bahasa lain?
Sumber daya terbaik yang saya temukan sejauh ini di C adalah perpustakaan bernama Shark , yang memberikan C
/ C++
kemampuan untuk menggunakan Support Vector Machines, regresi linier (bukan non-linear dan regresi lanjutan lainnya seperti multinomial probit, dll) dan daftar pendek lainnya (hebat tapi) fungsi statistik.