Pertanyaan yang diberi tag «data.table»

Paket data.table R adalah perpanjangan dari data.frame yang dibangun untuk analisis data dalam memori yang cepat. Gunakan tag dt untuk paket DataTables dengan Shiny (DT).

2
Cara menyusun ulang kolom data.table (tanpa menyalin)
Saya ingin kolom menyusun ulang di saya data.table x, diberikan vektor karakter nama kolom, neworder: library(data.table) x <- data.table(a = 1:3, b = 3:1, c = runif(3)) neworder <- c("c", "b", "a") Jelas saya bisa melakukan: x[ , neworder, with = FALSE] # or x[ , ..neworder] # c b …
118 r  data.table 

2
Apa tujuan menyetel kunci dalam data.table?
Saya menggunakan data.table dan ada banyak fungsi yang mengharuskan saya untuk menyetel kunci (misalnya X[Y]). Karena itu, saya ingin memahami apa yang dilakukan kunci untuk mengatur kunci dengan benar dalam tabel data saya. Satu sumber yang saya baca adalah ?setkey. setkey()mengurutkan data.tabledan menandainya sebagai diurutkan. Kolom yang diurutkan adalah kuncinya. …
113 r  data.table 

8
Membersihkan nilai `Inf` dari kerangka data R.
Di R, saya memiliki operasi yang membuat beberapa Infnilai ketika saya mengubah kerangka data. Saya ingin mengubah Infnilai - nilai ini menjadi NAnilai. Kode yang saya miliki lambat untuk data besar, apakah ada cara yang lebih cepat untuk melakukan ini? Katakanlah saya memiliki dataframe berikut: dat <- data.frame(a=c(1, Inf), b=c(Inf, …
101 r  dataframe  data.table 

5
Apa cara tercepat untuk menggabungkan / menggabungkan data.frames di R?
Misalnya (tidak yakin apakah contoh yang paling representatif): N <- 1e6 d1 <- data.frame(x=sample(N,N), y1=rnorm(N)) d2 <- data.frame(x=sample(N,N), y2=rnorm(N)) Inilah yang saya dapatkan sejauh ini: d <- merge(d1,d2) # 7.6 sec library(plyr) d <- join(d1,d2) # 2.9 sec library(data.table) dt1 <- data.table(d1, key="x") dt2 <- data.table(d2, key="x") d <- data.frame( …

6
Mendapatkan nilai tertinggi menurut kelompok
Berikut ini contoh kerangka data: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Saya ingin subset dberisi baris dengan 5 nilai teratas xuntuk setiap nilai grp. Menggunakan base-R, pendekatan saya akan menjadi seperti: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) heads <- lapply(splits, …
93 r  data.table  dplyr 


4
dplyr di data.table, apakah saya benar-benar menggunakan data.table?
Jika saya menggunakan sintaks dplyr di atas datatable , apakah saya mendapatkan semua manfaat kecepatan dari datatable saat masih menggunakan sintaks dplyr? Dengan kata lain, apakah saya salah menggunakan datatable jika saya menanyakannya dengan sintaks dplyr? Atau apakah saya perlu menggunakan sintaks datatable murni untuk memanfaatkan semua kekuatannya. Terima kasih …
91 r  data.table  dplyr 


5
data.tabel secara linear menginterpolasi nilai-nilai NA tanpa grup
Saya ingin mengisi beberapa nilai NA dalam data.tabel tanpa grup. Silakan pertimbangkan ekstrak data ini. Tabel yang mewakili waktu dan jarak: library(data.table) df <- data.frame(time = seq(7173, 7195, 1), dist = c(31091.33, NA, 31100.00, 31103.27, NA, NA, NA, NA, 31124.98, NA,31132.81, NA, NA, NA, NA, 31154.19, NA, 31161.47, NA, NA, …
18 r  data.table 


1
Manfaat kinerja dari rantai lebih dari ANDing saat memfilter tabel data
Saya memiliki kebiasaan menggabung tugas-tugas serupa menjadi satu baris. Sebagai contoh, jika saya perlu menyaring a, bdan cdalam tabel data, saya akan menempatkan mereka bersama-sama dalam satu []dengan ANDs. Kemarin, saya perhatikan bahwa dalam kasus khusus saya ini adalah filter chaining yang sangat lambat dan diuji. Saya telah memasukkan contoh …
12 r  data.table 

6
pisahkan kolom karakter dan dapatkan nama bidang dalam string
Saya perlu membagi kolom yang berisi informasi menjadi beberapa kolom. Saya akan menggunakan tstrsplittetapi jenis informasi yang sama tidak dalam urutan yang sama di antara baris dan saya perlu mengekstrak nama kolom baru dalam variabel. Penting untuk diketahui: mungkin ada banyak informasi (bidang untuk menjadi variabel baru) dan saya tidak …
11 r  data.table  reshape 


3
Apa yang tidak bisa saya lakukan dengan dtplyr yang saya dapat di data.table
Haruskah saya menginvestasikan upaya belajar saya untuk perselisihan data dalam R, khususnya di antara dplyr, dtplyrdan data.table? Saya menggunakan dplyrsebagian besar, tetapi ketika data terlalu besar untuk itu saya akan gunakan data.table, yang jarang terjadi. Jadi sekarang dtplyrv1.0 keluar sebagai antarmuka untuk data.table, di permukaan sepertinya saya tidak perlu khawatir …
9 r  dplyr  data.table  dtplyr 
Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.