Ketika saya mengajar statistik tingkat pascasarjana, saya memberi tahu murid-murid saya: "Saya tidak peduli paket apa yang Anda gunakan, dan Anda dapat menggunakan apa pun untuk pekerjaan rumah Anda, karena saya berharap Anda memberikan penjelasan substantif, dan akan mengambil poin jika saya Lihat tr23y5m
nama variabel dalam kiriman Anda. Saya dapat mendukung pembelajaran Anda dengan sangat baik di Stata, dan cukup baik, di R. Dengan SAS, Anda sendirian, karena Anda mengklaim telah mengikuti kursus di dalamnya. Dengan SPSS atau Minitab, Tuhan memberkati Anda ". Saya membayangkan bahwa majikan yang masuk akal akan berpikiran sama. Yang penting adalah produktivitas Anda dalam hal hasil proyek. Jika Anda dapat mencapai tujuan dalam R dengan 40 jam kerja, baiklah; jika Anda dapat mencapainya dalam C ++ dalam 40 jam kerja, baik, jika Anda tahu bagaimana melakukan ini dalam R dalam 40 jam, tetapi penyelia Anda ingin Anda melakukan ini di SAS, dan Anda harus menghabiskan 60 jam hanya untuk mempelajari beberapa dasar-dasar dan di mana titik koma pergi, itu hanya bisa menjadi bijaksana dalam konteks gambaran besar sisa kode berada di SAS ... dan kemudian manajer itu tidak sangat bijaksana dalam mempekerjakan seorang programmer R.
Dari perspektif biaya total ini, "gratis" R adalah mitos yang sangat berlebihan. Setiap proyek serius memerlukan kode khusus, jika hanya untuk input data dan memformat output, dan itu bukan biaya nol waktu profesional. Jika ini input data dan format membutuhkan 10 jam kode SAS dan 20 jam kode R, R adalah perangkat lunak lebih mahal di margin , sebagai ekonom akan mengatakan, yaitu, dalam hal biaya tambahan untuk menghasilkan bagian tertentu dari fungsi . Jika sebuah proyek besar membutuhkan 200 jam waktu programmer R dan waktu programmer Stata 100 jam untuk menyediakan fungsionalitas yang identik, Stata secara keseluruhan lebih murah, bahkan memperhitungkan lisensi ~ $ 1K yang perlu Anda beli. Akan menarik untuk melihat perbandingan langsung seperti itu; Saya terlibat dalam penulisan ulang kekacauan besar 2Mb kode SPSS yang dikatakan telah terakumulasi selama sekitar 10 orang-tahun menjadi ~ 150K kode Stata yang berjalan secepat, mungkin sedikit lebih cepat; itu proyek sekitar 1 orang-tahun. Saya tidak tahu apakah rasio efisiensi 10: 1 ini tipikal untuk perbandingan SPSS: Stata, tetapi saya tidak akan terkejut jika itu benar. Bagi saya, bekerja dengan R selalu merupakan biaya besar karena biaya pencarian: Saya harus menentukan yang mana dari lima paket dengan nama yang sama yang melakukan apa yang perlu saya lakukan, dan mengukur apakah itu cukup andal bagi saya untuk menggunakannya dalam pekerjaan saya. Ini sering berarti bahwa lebih murah bagi saya untuk menulis kode Stata saya sendiri dalam waktu yang lebih sedikit daripada yang akan saya habiskan untuk mencari tahu bagaimana membuat R bekerja dalam tugas yang diberikan. Harus dipahami bahwa ini adalah keistimewaan pribadi saya; kebanyakan orang di situs ini adalah pengguna yang lebih baik daripada saya.
Lucu bahwa prof Anda lebih suka Stata atau GAUSS daripada R karena "R tidak ditulis oleh para ekonom". Baik itu Stata atau GAUSS; mereka ditulis oleh para ilmuwan komputer menggunakan alat ilmuwan komputer. Jika prof Anda mendapat ide tentang pemrograman dari CodeAcademy.com, itu lebih baik daripada tidak sama sekali, tetapi pengembangan perangkat lunak kelas profesional berbeda dari mengetik di kotak teks CodeAcademy.com seperti mengendarai truk barang berbeda dari bersepeda. (Stata dimulai oleh seorang ilmuwan komputer yang dikonversi oleh ahli ekonometrika tenaga kerja, tetapi ia belum melakukan pekerjaan ini dalam bidang ekonometrik selama sekitar 25 tahun sekarang.)
Pembaruan : Seperti yang dikomentari AndyW di bawah ini, Anda dapat menulis kode mengerikan dalam bahasa apa pun. Pertanyaan tentang biaya kemudian menjadi, bahasa mana yang lebih mudah di-debug. Bagi saya ini terlihat seperti kombinasi dari seberapa akurat dan informatif outputnya, dan betapa mudah dan transparannya sintaks itu sendiri, dan saya tidak punya jawaban yang bagus untuk itu, tentu saja. Sebagai contoh, Python memberlakukan indentasi kode, yang merupakan ide bagus. Stata dan kode R dapat dilipat di atas kurung, dan itu tidak akan bekerja dengan SAS. Penggunaan subrutin adalah pedang bermata dua: penggunaan *apply()
dengan ad-hoc function
di R jelas sangat efisien, tetapi lebih sulit untuk di-debug. Dengan token yang serupa, Stata local
s dapat menutupi hampir semua hal, dan default ke string kosong, sementara berguna, juga dapat menyebabkan kesalahan yang sulit ditangkap.