Pertanyaan yang diberi tag «data.table»

Paket data.table R adalah perpanjangan dari data.frame yang dibangun untuk analisis data dalam memori yang cepat. Gunakan tag dt untuk paket DataTables dengan Shiny (DT).

3
data.table vs dplyr: dapatkah seseorang melakukan sesuatu dengan baik sedangkan yang lain tidak atau buruk?
Gambaran Saya relatif akrab dengan data.table, tidak begitu banyak dengan dplyr. Saya telah membaca beberapa dplyrsketsa dan contoh yang muncul di SO, dan sejauh ini kesimpulan saya adalah: data.tabledan dplyrsebanding dalam kecepatan, kecuali ketika ada banyak (yaitu> 10-100K) kelompok, dan dalam beberapa keadaan lain (lihat tolok ukur di bawah) dplyr …
760 r  data.table  dplyr 

8
Bagaimana Anda menghapus kolom dengan nama di data.table?
Untuk menghilangkan kolom bernama "foo" dalam data.frame, saya dapat melakukan: df <- df[-grep('foo', colnames(df))] Namun, setelah dfdikonversi ke data.tableobjek, tidak ada cara untuk hanya menghapus kolom. Contoh: df <- data.frame(id = 1:100, foo = rnorm(100)) df2 <- df[-grep('foo', colnames(df))] # works df3 <- data.table(df) df3[-grep('foo', colnames(df3))] Tapi begitu dikonversi menjadi …
195 r  data.table 

2
Memahami kapan tepatnya data.table adalah referensi ke (vs salinan) data.table lain
Saya mengalami sedikit kesulitan memahami properti pass-by-reference dari data.table. Beberapa operasi tampaknya 'mematahkan' referensi, dan saya ingin memahami persis apa yang terjadi. Pada membuat data.tabledari yang lain data.table(via <-, kemudian memperbarui tabel baru dengan :=, tabel asli juga diubah. Ini diharapkan, sesuai: ?data.table::copy dan stackoverflow: pass-by-referensi-operator-dalam-data-tabel-paket Ini sebuah contoh: library(data.table) …

3
Apa yang dimaksud dengan .SD di data.table di R
.SDterlihat bermanfaat tetapi saya tidak benar-benar tahu apa yang saya lakukan dengannya. Apa artinya itu? Mengapa ada periode sebelumnya (berhenti penuh). Apa yang terjadi ketika saya menggunakannya? Saya membaca: .SDadalah data.tablesubkumpulan xdata untuk setiap grup, tidak termasuk kolom grup. Ini dapat digunakan saat pengelompokan berdasarkan i, saat pengelompokan oleh by, …
173 r  data.table 

4
Mengapa panda digabung dalam python lebih cepat dari data.tabel digabung dalam R pada 2012?
Saya baru-baru ini menemukan panda library untuk python, yang menurut tolok ukur ini melakukan penggabungan in-memory yang sangat cepat. Ini bahkan lebih cepat daripada paket data.table di R (bahasa pilihan saya untuk analisis). Mengapa pandasjauh lebih cepat daripada data.table? Apakah karena keuntungan kecepatan python yang melekat memiliki lebih dari R, …
160 python  r  join  data.table  pandas 


6
Bagaimana cara menghapus baris dengan referensi di data.table?
Pertanyaan saya terkait dengan penugasan dengan referensi versus menyalin data.table. Saya ingin tahu apakah seseorang dapat menghapus baris dengan referensi, mirip dengan DT[ , someCol := NULL] Saya ingin tahu tentang DT[someRow := NULL, ] Saya kira ada alasan bagus mengapa fungsi ini tidak ada, jadi mungkin Anda bisa menunjukkan …
150 r  data.table 



17
Mengganti NAS dengan nilai non-NA terbaru
Dalam data.frame (atau data.table), saya ingin "mengisi maju" NAS dengan nilai non-NA terdekat sebelumnya. Contoh sederhana, menggunakan vektor (bukan a data.frame) adalah sebagai berikut: > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Saya ingin fungsi fill.NAs()yang memungkinkan saya membangun yysedemikian rupa sehingga: > yy [1] …
141 r  data.table  zoo  r-faq 

2
Mengapa rbindlist lebih baik daripada rbind?
Saya akan melalui dokumentasi data.tabledan juga memperhatikan dari beberapa percakapan di sini pada SO yang rbindlistseharusnya lebih baik daripada rbind. Saya ingin tahu mengapa rbindlistlebih baik daripada rbinddan di mana skenario yang rbindlistbenar-benar unggul rbind? Apakah ada keuntungan dalam hal pemanfaatan memori?
135 r  data.table  rbind  rbindlist 


3
Urutan baris dalam data.table dalam urutan menurun pada kunci string `order (-x, v)` memberikan kesalahan pada data.table 1.9.4 atau sebelumnya
Katakanlah saya memiliki berikut data.tabledi R: library(data.table) DT = data.table(x=rep(c("b","a","c"),each=3), y=c(1,3,6), v=1:9) Saya ingin memesannya dengan dua kolom (katakanlah kolom xdan v). Saya menggunakan ini: DT[order(x,v)] # sorts first by x then by v (both in ascending order) Tapi sekarang, saya ingin mengurutkannya x(dalam urutan menurun) dan memiliki kode berikut: …
125 r  string  sorting  data.table  key 

3
Mengapa X [Y] gabungan dari data.tables tidak mengizinkan gabungan luar penuh, atau gabungan kiri?
Ini adalah sedikit pertanyaan filosofis tentang sintaks gabungan data.table. Saya menemukan semakin banyak kegunaan untuk data.tables, tetapi masih belajar ... Format X[Y]gabungan untuk data.tables sangat ringkas, praktis dan efisien, tetapi sejauh yang saya tahu, ini hanya mendukung gabungan dalam dan gabungan luar kanan. Untuk mendapatkan gabungan luar kiri atau penuh, …
123 r  join  data.table 

8
Mengonversi kelas kolom di data.table
Saya punya masalah menggunakan data.table: Bagaimana cara mengonversi kelas kolom? Berikut ini contoh sederhananya: Dengan data.frame saya tidak memiliki masalah untuk mengubahnya, dengan data.table saya tidak tahu caranya: df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way df[, "value"] <- as.numeric(df[, …
118 r  data.table 

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.