Pertanyaan yang diberi tag «dplyr»

Gunakan tag ini untuk pertanyaan yang berkaitan dengan fungsi dari paket dplyr, seperti group_by, meringkas, memfilter, dan memilih.

5
Kumpulkan beberapa set kolom
Saya memiliki data dari survei online di mana responden melewati putaran pertanyaan 1-3 kali. Perangkat lunak survei (Qualtrics) mencatat data ini dalam beberapa kolom-yaitu, Q3.2 dalam survei akan memiliki kolom Q3.2.1., Q3.2.2.dan Q3.2.3.: df <- data.frame( id = 1:10, time = as.Date('2009-01-01') + 0:9, Q3.2.1. = rnorm(10, 0, 1), Q3.2.2. …
108 r  reshape  dplyr  qualtrics  tidyr 

6
Jumlahkan di beberapa kolom dengan dplyr
Pertanyaan saya melibatkan penjumlahan nilai di beberapa kolom dari bingkai data dan membuat kolom baru yang sesuai dengan penjumlahan ini menggunakan dplyr. Entri data di kolom adalah biner (0,1). Saya sedang memikirkan analog bijak darisummarise_each atau mutate_eachfungsi dplyr. Di bawah ini adalah contoh minimal dari bingkai data: library(dplyr) df=data.frame( x1=c(1,0,0,NA,0,1,1,NA,0,1), …
98 r  dplyr 

6
filter untuk kasus lengkap di data.frame menggunakan dplyr (penghapusan kasus)
Apakah mungkin untuk memfilter data.frame untuk kasus lengkap menggunakan dplyr? complete.casesdengan daftar semua variabel bekerja, tentu saja. Tapi itu a) verbose ketika ada banyak variabel dan b) tidak mungkin ketika nama variabel tidak diketahui (misalnya dalam fungsi yang memproses data.frame). library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) …
97 r  dplyr  magrittr 

4
dplyr meringkas: Setara dengan ".drop = FALSE" untuk menyimpan grup dengan panjang keluaran nol
Bila menggunakan summarisedengan plyr's ddplyfungsi, kategori kosong dijatuhkan oleh default. Anda dapat mengubah perilaku ini dengan menambahkan .drop = FALSE. Namun, ini tidak berfungsi saat digunakan summarisedengan dplyr. Apakah ada cara lain untuk menjaga kategori kosong dalam hasil? Berikut contoh data palsu. library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(1:2,6)) # Now add …
97 r  dplyr  plyr  tidyr 


8
R dplyr: Menurunkan beberapa kolom
Saya memiliki dataframe dan daftar kolom dalam dataframe yang ingin saya hapus. Mari gunakan irisdataset sebagai contoh. Saya ingin melepas Sepal.Lengthdan Sepal.Widthdan hanya menggunakan kolom yang tersisa. Bagaimana cara melakukannya menggunakan selectatau select_dari dplyrpaket? Inilah yang saya coba sejauh ini: drop.cols <- c('Sepal.Length', 'Sepal.Width') iris %>% select(-drop.cols) Kesalahan dalam -drop.cols: …
96 r  dplyr 

1
Bagaimana menafsirkan pesan dplyr `summarize ()` mengelompokkan kembali keluaran dengan 'x' (menimpa dengan argumen `.groups`)?
Saya mulai mendapatkan pesan baru (lihat judul posting) ketika menjalankan group_by dan meringkas () setelah memperbarui ke versi pengembangan dplyr 0.8.99.9003. Berikut adalah contoh untuk membuat ulang output: library(tidyverse) library(hablar) df <- read_csv("year, week, rat_house_females, rat_house_males, mouse_wild_females, mouse_wild_males 2018,10,1,1,1,1 2018,10,1,1,1,1 2018,11,2,2,2,2 2018,11,2,2,2,2 2019,10,3,3,3,3 2019,10,3,3,3,3 2019,11,4,4,4,4 2019,11,4,4,4,4") %>% convert(chr(year,week)) %>% mutate(total_rodents …
95 r  dplyr  summarize 

5
R Evaluasi bersyarat saat menggunakan operator pipa%>%
Bila menggunakan operator pipa %>%dengan paket seperti dplyr, ggvis, dycharts, dll, bagaimana saya melakukan langkah bersyarat? Sebagai contoh; step_1 %>% step_2 %>% if(condition) step_3 Pendekatan ini sepertinya tidak berhasil: step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2 %>% if(condition) step_3 Ada jalan panjang: if(condition) { step_1 %>% step_2 }else{ …
94 r  dplyr  ggvis  magrittr 

6
Mendapatkan nilai tertinggi menurut kelompok
Berikut ini contoh kerangka data: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Saya ingin subset dberisi baris dengan 5 nilai teratas xuntuk setiap nilai grp. Menggunakan base-R, pendekatan saya akan menjadi seperti: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) heads <- lapply(splits, …
93 r  data.table  dplyr 

4
dplyr di data.table, apakah saya benar-benar menggunakan data.table?
Jika saya menggunakan sintaks dplyr di atas datatable , apakah saya mendapatkan semua manfaat kecepatan dari datatable saat masih menggunakan sintaks dplyr? Dengan kata lain, apakah saya salah menggunakan datatable jika saya menanyakannya dengan sintaks dplyr? Atau apakah saya perlu menggunakan sintaks datatable murni untuk memanfaatkan semua kekuatannya. Terima kasih …
91 r  data.table  dplyr 

2
Bagaimana cara menentukan nama kolom untuk x dan y saat bergabung dalam dplyr?
Saya memiliki dua bingkai data yang ingin saya gabungkan menggunakan dplyr. Salah satunya adalah bingkai data yang berisi nama depan. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) Kerangka data lainnya berisi versi korpus nama Kantrowitz yang telah dibersihkan, mengidentifikasi jenis kelamin. Berikut adalah contoh minimalnya: …
91 r  join  left-join  dplyr 

3
dplyr bermutasi dengan nilai bersyarat
Dalam kerangka data besar ("myfile") dengan empat kolom saya harus menambahkan kolom kelima dengan nilai bersyarat berdasarkan empat kolom pertama. Lebih suka jawaban dengan dplyrdan mutate, terutama karena kecepatannya dalam kumpulan data besar. Dataframe saya terlihat seperti ini: V1 V2 V3 V4 1 1 2 3 5 2 2 4 …
88 r  dplyr  mutate 

7
Bagaimana cara mengganti NA dengan set nilai
Saya memiliki bingkai data berikut: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Ini terlihat seperti ini: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 …
18 r  dplyr  tibble 


1
Cara pivot dataframe yang terdiri dari kolom dengan bagian dan sub bagian di R
Saya memiliki kerangka data yang disebutkan di bawah ini: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", …

Dengan menggunakan situs kami, Anda mengakui telah membaca dan memahami Kebijakan Cookie dan Kebijakan Privasi kami.
Licensed under cc by-sa 3.0 with attribution required.