Re: [問題] facebook粉絲團耙文

作者: kevinsky (kevinsky)   2014-07-29 15:45:53
※ 引述《kevinsky (kevinsky)》之銘言:
: 程式諮詢:
: 網路上有一些facebook的R語言截取資訊教學
: 但是最近想從粉絲團來蒐集資訊
: 卻沒辦法把網頁抓進我的程式裡面
: 程式碼如下:
: library(RCurl)
: library(XML)
: library(Rook)
: library(Rfacebook)
: options(RCurlOptions = list(verbose = FALSE, capath = system.file("CurlSSL",
: "cacert.pem", package = "RCurl"), ssl.verifypeer = FALSE))
: html = getURL("https://www.facebook.com/Yankees.Taiwan")
: print(html)
: 我print出來的結果always是空的
: 但是若換成其他https網站是可以抓到網頁程式碼的
: 不知道大家有沒有什麼建議呢?
: 謝謝
我把其中一行修改成
html = getURL("https://www.facebook.com/Yankees.Taiwan", followlocation =
TRUE, cainfo = system.file("CurlSSL", "cacert.pem", package = "RCurl"))
就能print出來一些html內容
但是該網頁的po文仍不在所抓取的html內容裡面
不知道大家有沒有什麼建議呢?
謝謝
作者: kenshin528 (成立奧凶帝國!!)   2014-07-29 17:29:00
直接呼叫fb 的API 如何 ?
作者: gsuper (Logit(odds))   2014-08-01 09:09:00
看起來是個很難的問題我之前parse股票資訊的時後有做過類似的事KeyPoint is to "Print" html but not download SourceCode
作者: Wush978 (拒看低質媒體)   2014-08-02 11:07:00
最近我們社群有在介紹phantomjs我覺得這種問題可能用其他工具更簡單

Links booklink

Contact Us: admin [ a t ] ucptt.com