Setelah membaca dataset:
dataset <- read.csv("forR.csv")
- Bagaimana saya bisa mendapatkan R untuk memberi saya jumlah kasus di dalamnya?
- Juga, akankah nilai yang dikembalikan mencakup kasus-kasus yang dikecualikan dihilangkan
na.omit(dataset)
?
Setelah membaca dataset:
dataset <- read.csv("forR.csv")
na.omit(dataset)
?Jawaban:
dataset
akan menjadi bingkai data. Karena saya tidak punya forR.csv
, saya akan membuat bingkai data kecil untuk ilustrasi:
set.seed(1)
dataset <- data.frame(A = sample(c(NA, 1:100), 1000, rep = TRUE),
B = rnorm(1000))
> head(dataset)
A B
1 26 0.07730312
2 37 -0.29686864
3 57 -1.18324224
4 91 0.01129269
5 20 0.99160104
6 90 1.59396745
Untuk mendapatkan jumlah kasus, hitung jumlah baris menggunakan nrow()
atau NROW()
:
> nrow(dataset)
[1] 1000
> NROW(dataset)
[1] 1000
Untuk menghitung data setelah menghilangkan NA
, menggunakan alat yang sama, tetapi membungkus dataset
di na.omit()
:
> NROW(na.omit(dataset))
[1] 993
Perbedaan antara NROW()
dan NCOL()
dan varian huruf kecilnya ( ncol()
dan nrow()
) adalah bahwa versi huruf kecil hanya akan berfungsi untuk objek yang memiliki dimensi (array, matriks, bingkai data). Versi huruf besar akan bekerja dengan vektor, yang diperlakukan seolah-olah mereka adalah matriks 1 kolom, dan kuat jika Anda akhirnya mengelompokkan data Anda sehingga R menjatuhkan dimensi kosong.
Atau, gunakan complete.cases()
dan sum
itu ( complete.cases()
mengembalikan vektor logis [ TRUE
atau FALSE
] yang menunjukkan jika ada pengamatan NA
untuk setiap baris.
> sum(complete.cases(dataset))
[1] 993
Secara singkat:
Jalankan dim(dataset)
untuk mengambil kedua n dan k , Anda juga dapat menggunakan nrow(df)
dan ncol(df)
(dan bahkan NROW(df)
dan NCOL(df)
- varian diperlukan untuk tipe lain juga).
Jika Anda mentransformasikan mis via dataset <- na.omit(dataset)
, maka kasing hilang dan tidak dihitung. Tetapi jika Anda melakukannya misalnya summary(dataset)
, kasus-kasus NA dicatat.
str()
karena memberikan detail berguna lainnya tentang objek Anda. Sering dapat menjelaskan mengapa kolom tidak berperilaku sebagaimana mestinya (faktor bukan angka, dll).