因為你沒處理 over18 的 cookie
library(RCurl)
curl <- getCurlHandle()
curlSetOpt(cookie="over18=1", followlocation = TRUE, curl=curl)
url <- 'https://www.ptt.cc/bbs/Gossiping/index20865.html'
html <- getURL(url, curl=curl)
這樣應該就沒問題了
※ 引述《iwfmf (i @#$%@#$^$%^ f)》之銘言:
: : 再用R爬蟲抓取八卦版,但在getURL 時,抓取的資料為空
: [程式範例]:
:
: > url
: [1] "https://www.ptt.cc/bbs/Gossiping/index20865.html"
: > html = getURL(url,ssl.verifypeer = FALSE,encoding="UTF-8")
: > html
: [1] ""