Re: [問題] facebook粉絲團耙文 kevinsky PTT批踢踢實業坊

Re: [問題] facebook粉絲團耙文

作者: kevinsky (kevinsky) 2014-07-29 15:45:53

※ 引述《kevinsky (kevinsky)》之銘言：
: 程式諮詢：
: 網路上有一些facebook的R語言截取資訊教學
: 但是最近想從粉絲團來蒐集資訊
: 卻沒辦法把網頁抓進我的程式裡面
: 程式碼如下：
: library(RCurl)
: library(XML)
: library(Rook)
: library(Rfacebook)
: options(RCurlOptions = list(verbose = FALSE, capath = system.file("CurlSSL",
: "cacert.pem", package = "RCurl"), ssl.verifypeer = FALSE))
: html = getURL("https://www.facebook.com/Yankees.Taiwan")
: print(html)
: 我print出來的結果always是空的
: 但是若換成其他https網站是可以抓到網頁程式碼的
: 不知道大家有沒有什麼建議呢?
: 謝謝
我把其中一行修改成
html = getURL("https://www.facebook.com/Yankees.Taiwan", followlocation =
TRUE, cainfo = system.file("CurlSSL", "cacert.pem", package = "RCurl"))
就能print出來一些html內容
但是該網頁的po文仍不在所抓取的html內容裡面
不知道大家有沒有什麼建議呢?
謝謝

作者: kenshin528 (成立奧凶帝國!!) 2014-07-29 17:29:00

直接呼叫fb 的API 如何？

作者: gsuper (Logit(odds)) 2014-08-01 09:09:00

看起來是個很難的問題我之前parse股票資訊的時後有做過類似的事KeyPoint is to "Print" html but not download SourceCode

作者: Wush978 (拒看低質媒體) 2014-08-02 11:07:00

最近我們社群有在介紹phantomjs我覺得這種問題可能用其他工具更簡單

繼續閱讀

[問題] facebook粉絲團耙文kevinsky [問題] 資料整理ddtddt Re: [問題] data.table 改值HeroNoah [問題] data.table 改值celestialgod [問題] 關於自定義函數Ceferino Re: [心得] sqldf效率問題celestialgod [心得] sqldf效率問題kenshin528 [分享] R 語言的工程面Wush978 [問題] 關於 R 介面問題rockken Re: [問題] 如何以RS232讀入即時資訊Watermelonnn