Paket R apa yang menurut Anda paling berguna dalam pekerjaan sehari-hari Anda?


28

Duplikat utas: Saya baru saja menginstal versi terbaru R. Paket apa yang harus saya peroleh?

Apa paket R yang tidak bisa Anda bayangkan pekerjaan harian Anda dengan data? Harap sebutkan alat umum dan khusus.

UPDATE: Adapun 24.10.10 ggplot2tampaknya menjadi pemenang dengan 7 suara.

Paket lain yang disebutkan lebih dari satu adalah:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Terima kasih atas jawaban Anda!


1
Pertanyaan yang sangat subyektif: pertanyaan ini tidak dapat dijawab, dan tidak cocok untuk situs QA.
Egon Willighagen

3
Mungkin seharusnya wiki komunitas; pertanyaan yang bermanfaat di sini tetapi tidak memiliki jawaban yang pasti.
Shane

2
@ Shane: poin bagus. terharu. @ Egon: subyektif memang. tetapi jika jawabannya datang dari orang-orang berpengetahuan saya tidak keberatan dosis subjektivitas. Saya sudah mulai belajar R baru-baru ini dan memiliki beberapa lusin diinstal untuk mengeksplorasi, namun saya perhatikan bahwa ada alat yang saya gunakan jauh lebih sering terlepas dari tugas yang ada.
radek

Akan menarik jika StackExchange dapat mendukung beberapa metode untuk menghubungkan posting wiki komunitas di seluruh situs. Karena saya berani bertaruh pertanyaan ini telah diajukan di Stackoverflow dan saya juga berpikir bahwa Analisis Statistik mungkin menarik beberapa orang yang biasanya tidak mengunjungi SO.
Sharpie

@Sharpie: ada beberapa posting SO yang menarik seperti stackoverflow.com/questions/1295955/… atau stackoverflow.com/questions/1535021/… namun mereka tidak fokus pada paket. dan saya setuju, hubungan komunitas wiki bisa sangat berguna.
Radek

Jawaban:




8

Saya menggunakan paket xtable . Paket xtable mengubah tabel yang dihasilkan oleh R (khususnya, tabel yang menampilkan hasil anova) menjadi tabel LaTeX, untuk dimasukkan dalam artikel.



8

ggplot2 - visualisasi terbaik ke bawah untuk R.

RMySQL / RSQLite / RODBC - untuk menghubungkan ke database

sqldf - memanipulasi data.frame dengan query SQL

Hmisc / rms - paket dari Frank Harrell yang berisi fungsi lain-lain yang nyaman dan fungsi yang bagus untuk analisis regresi.

GenABEL - paket yang bagus untuk studi asosiasi genome

Rcmdr - GUI yang layak untuk R jika Anda membutuhkannya.

Lihat juga CRANtastic - tautan ini memiliki daftar paket R yang paling populer. Banyak di bagian atas daftar sudah ada


8

data.table adalah favorit saya sekarang! Sangat menantikan versi baru dengan lebih banyak wishlist diimplementasikan.



6

Bagi saya pribadi, saya paling sering menggunakan tiga paket berikut, semua tersedia dari Proyek Omega yang luar biasa untuk Komputasi Statistik (saya tidak mengklaim sebagai seorang ahli, tetapi untuk tujuan saya mereka sangat mudah digunakan):

  • RCurl : Ini memiliki banyak opsi yang memungkinkan akses ke situs web bahwa fungsi-fungsi default di basis R akan mengalami kesulitan dengan saya pikir itu adil untuk dikatakan. Ini adalah antarmuka-R ke perpustakaan libcurl, yang memiliki manfaat tambahan dari seluruh komunitas di luar R yang mengembangkannya. Juga tersedia di CRAN .

  • XML : Ini sangat memaafkan parsing XML / HTML cacat. Ini adalah antarmuka-R ke perpustakaan libxml2 dan sekali lagi memiliki manfaat tambahan dari seluruh komunitas di luar R yang mengembangkannya. Juga tersedia di CRAN .

  • RJSONIO : Ini memungkinkan seseorang untuk mem-parsing teks yang dikembalikan dari panggilan json dan mengaturnya ke dalam struktur daftar untuk analisis lebih lanjut. Pesaing untuk paket ini adalah rjson tetapi yang ini memiliki keuntungan menjadi vektor, siap diperluas melalui S3 / S4, cepat dan terukur ke data besar.

6

Sweave memungkinkan Anda menanamkan kode R dalam dokumen LaTeX. Hasil dari mengeksekusi kode, dan secara opsional kode sumber, menjadi bagian dari dokumen akhir.

Jadi alih-alih, misalnya, menempelkan gambar yang dihasilkan oleh R ke dalam file LaTeX, Anda dapat menempelkan kode R ke dalam file dan menyimpan semuanya di satu tempat.


4
Sekedar petunjuk bagi semua yang ingin memulai penelitian yang dapat direproduksi dengan R. Saya akan menyarankan Anda untuk melihat-lihat paket yang agak baru knitrdaripada Sweave. Ini pada dasarnya berkeringat dengan steroid. Mudah, jika tidak mudah, untuk belajar dan jauh lebih fleksibel.
Christoph_J

4

kebun binatang dan xts adalah suatu keharusan dalam pekerjaan saya!


4

Saya menemukan kisi bersama dengan buku pendamping "Lattice: Visualisasi Data Multivariat dengan R" oleh Deepayan Sarkar sangat berharga.


4

Jika Anda melakukan segala jenis pemodelan prediktif, tanda sisipan adalah anugerah. Terutama dikombinasikan dengan paket multicore , beberapa hal yang luar biasa mungkin terjadi.


4

Sehari-hari paket yang paling berguna haruslah "asing" yang memiliki fungsi untuk membaca dan menulis data untuk paket statistik lainnya misalnya Stata, SPSS, Minitab, SAS, dll. Bekerja di bidang di mana R tidak biasa berarti bahwa ini adalah paket yang sangat penting.


3

saya menggunakan

mobil, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplot, gtools), Hmisc, plyr, RCurl, RDCOMClient, membentuk kembali, RODBC, TeachingDemos, XML.

banyak.


3

Saya tidak bisa hidup tanpa:

  • kisi untuk grafik
  • xlsx atau XLConnect untuk membaca file Excel
  • rtf untuk membuat laporan dalam format rtf (saya lebih suka Sword atau R2wd tetapi saya tidak dapat menginstal statconn di tempat kerja; saya pasti akan mencoba odfWeave segera .)
  • nlme dan lme4 untuk model campuran
  • ff untuk bekerja dengan array besar

2

RODBC untuk mengakses data dari database, sqldf untuk melakukan query SQL sederhana pada dataframe (walaupun saya memaksa diri saya untuk menggunakan perintah R asli), dan ggplot2 dan plyr



2

Kami kebanyakan menggunakan:

  • ggplot - untuk grafik
  • statistik
  • e1071 - untuk SVM

Anda mungkin juga ingin memeriksa kernlab dan tanda sisipan untuk SVM. Mereka adalah alternatif yang menarik (dianggap belum tentu lebih baik).
Zach


2

Bagi saya, saya menggunakan kernlab untuk Lab Pembelajaran Mesin berbasis kernel dan e1071 untuk SVM dan ggplot2 untuk grafik


2

Saya sering menggunakan ggplot2, vegan, dan membentuk kembali.



2

RColorBrewer belum disebutkan di sini, saya sering menggunakannya untuk merencanakan jika saya perlu skema warna


2

Saya penggemar berat RCPP ketika saya membutuhkan loop cepat untuk melakukan perawatan yang tidak sesuai R. Ini sangat baik diimplementasikan dalam sistem R eco, dapat menerima Matriks / Matriks jarang tanpa konversi sebagai argumen dalam suatu fungsi.

Sintaks C ++ mudah ketika Anda melakukan hal-hal sederhana (yang sering kali menjadi kasus saya).

Sungguh, Anda tidak perlu menjadi pembuat paket untuk membutuhkan lib yang luar biasa ini.

Apakah saya mengatakan C ++ sangat cepat?


2

Paket doParallel dan foreach telah membuat hidup saya jauh lebih mudah dengan memungkinkan saya untuk memparalelkan kode saya dan menjalankannya pada instance komputasi yang dioptimalkan di Amazon EC2 ! Saya sangat sering menggunakannya. Tapi itu tidak akan mungkin terjadi tanpa RStudio AMI yang dirilis oleh Louis Aslett. Akhirnya, saya harus menyebutkan paket stringr yang benar-benar membuat bekerja dengan string berjalan-jalan di taman. Gunakan di setiap aplikasi penambangan teks. Dan saya juga sering menggunakan rajutan untuk menghasilkan laporan berkualitas tinggi tentang pekerjaan saya. Terima kasih banyak untuk paket luar biasa ini Yihui Xie!


1

Saya menggunakan ggplot2, membentuk kembali, kisi, rajutan lebih sering.

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.