Baiklah kalau begitu: selamat datang di dunia R ;-)
Ini dia
Menyiapkan kode
urls <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz",
"xxxxx"
)
readUrl <- function(url) {
out <- tryCatch(
{
# Just to highlight: if you want to use more than one
# R expression in the "try" part then you'll have to
# use curly brackets.
# 'tryCatch()' will return the last evaluated expression
# in case the "try" part was completed successfully
message("This is the 'try' part")
readLines(con=url, warn=FALSE)
# The return value of `readLines()` is the actual value
# that will be returned in case there is no condition
# (e.g. warning or error).
# You don't need to state the return value via `return()` as code
# in the "try" part is not wrapped insided a function (unlike that
# for the condition handlers for warnings and error below)
},
error=function(cond) {
message(paste("URL does not seem to exist:", url))
message("Here's the original error message:")
message(cond)
# Choose a return value in case of error
return(NA)
},
warning=function(cond) {
message(paste("URL caused a warning:", url))
message("Here's the original warning message:")
message(cond)
# Choose a return value in case of warning
return(NULL)
},
finally={
# NOTE:
# Here goes everything that should be executed at the end,
# regardless of success or error.
# If you want more than one expression to be executed, then you
# need to wrap them in curly brackets ({...}); otherwise you could
# just have written 'finally=<expression>'
message(paste("Processed URL:", url))
message("Some other message at the end")
}
)
return(out)
}
Menerapkan kode
> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory
Investigasi hasilnya
> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"
[5] "</head><body>"
[6] ""
> length(y)
[1] 3
> y[[3]]
[1] NA
Tanda tambahan
coba tangkap
tryCatch
mengembalikan nilai yang terkait dengan mengeksekusi expr
kecuali ada kesalahan atau peringatan. Dalam hal ini, nilai-nilai pengembalian spesifik (lihat di return(NA)
atas) dapat ditentukan dengan memasok fungsi penangan masing-masing (lihat argumen error
dan warning
dalam ?tryCatch
). Ini bisa berupa fungsi yang sudah ada, tetapi Anda juga bisa mendefinisikannya di dalam tryCatch()
(seperti yang saya lakukan di atas).
Implikasi dari pemilihan nilai pengembalian spesifik dari fungsi handler
Seperti yang telah kami tentukan yang NA
harus dikembalikan jika terjadi kesalahan, elemen ketiga y
adalah NA
. Jika kita memilih NULL
untuk menjadi nilai balik, panjangnya y
saja 2
bukan 3
sebagai lapply()
hanya akan "mengabaikan" nilai balik yang ada NULL
. Juga perhatikan bahwa jika Anda tidak menentukan nilai balik eksplisit melalui return()
, fungsi pawang akan kembali NULL
(yaitu jika terjadi kesalahan atau kondisi peringatan).
Pesan peringatan "Tidak diinginkan"
Karena warn=FALSE
tampaknya tidak memiliki efek, cara alternatif untuk menekan peringatan (yang dalam hal ini tidak benar-benar menarik) adalah menggunakan
suppressWarnings(readLines(con=url))
dari pada
readLines(con=url, warn=FALSE)
Beragam ekspresi
Perhatikan bahwa Anda juga dapat menempatkan banyak ekspresi di "bagian ekspresi aktual" (argumen expr
dari tryCatch()
) jika Anda membungkusnya dalam kurung keriting (seperti yang saya ilustrasikan di finally
bagian).
paste
fungsi Anda berakhir dengan spasi, mengapa tidak menghilangkan spasi dansep=""
?