Untuk solusi yang bebas dari dependensi eksternal fiddly *, sekarang ada readxl
:
Paket readxl memudahkan pengambilan data dari Excel dan ke R. Dibandingkan dengan banyak paket yang ada (mis. Gdata, xlsx, xlsReadWrite) readxl tidak memiliki dependensi eksternal sehingga mudah untuk diinstal dan digunakan di semua sistem operasi. Ini dirancang untuk bekerja dengan data tabel yang disimpan dalam satu lembar.
Readxl mendukung format .xls lama dan format .xlsx berbasis xml modern. Dukungan .xls dimungkinkan dengan library C libxls, yang mengabstraksi banyak kerumitan format biner yang mendasarinya. Untuk mengurai .xlsx, kami menggunakan pustaka RapidXML C ++.
Itu dapat diinstal seperti ini:
install.packages("readxl")
atau
devtools::install_github("hadley/readxl")
Pemakaian
library(readxl)
read_excel("my-old-spreadsheet.xls")
read_excel("my-new-spreadsheet.xlsx")
read_excel("my-spreadsheet.xls", sheet = "data")
read_excel("my-spreadsheet.xls", sheet = 2)
read_excel("my-spreadsheet.xls", na = "NA")
* tidak sepenuhnya benar, itu membutuhkan Rcpp
paket , yang pada gilirannya membutuhkan Rtools (untuk Windows) atau Xcode (untuk OSX), yang merupakan dependensi di luar R. Tetapi mereka tidak memerlukan mengutak-atik jalur, dll., jadi itu adalah keuntungan atas ketergantungan Java dan Perl.
Perbarui Sekarang ada paket rexcel . Ini menjanjikan untuk mendapatkan pemformatan Excel, fungsi, dan banyak jenis informasi lainnya dari file Excel dan ke R.
.csv
.