[問題] Rselenium操作chrome爬取IE限定網頁問題

作者: nico831116 (P)   2020-06-17 09:39:45
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
使用者(已經有用R 做過不少作品)
[問題敘述]:
情境1:
我想要抓取某個只能限定IE開啟的網頁。
狀況大體上是用IE開的話可以看到html下面有head>div>table等等,我想要抓table裡的
元素。
但是用chrome開的話只能看到head,下面就都沒有東西了。
情境2:
因為是公司的電腦有權限問題,我無法安裝IE的driver。
情境3:
Google driver可以安裝,我可以用Rselenium啟動chrome爬取網頁。
情境4:
我已嘗試在Chrome上安裝附加元件IE-tab,並使用Rselenium開啟。但由於IE-tab是模擬
器的關係,我無法抓取用IE-tab所顯示的網頁元素。
問題:
請問有什麼方法可以突破這個難關?
或者有什麼其他的方式與思路可以讓我使用chrome爬取IE限定網站,想請各位版大開示一
下……
2020/6/20更新
發現好像是因為該網頁只能使用IE文件模式7和8,而非瀏覽器模式的問題。
不曉得Chrome有沒有辦法更改文件模式?
[關鍵字]:
Rselenium
作者: empireisme (empireisme)   2020-06-17 17:30:00
不然不要用R爬用python爬可以嗎
作者: andrew43 (討厭有好心推文後刪文者)   2020-06-17 18:07:00
IE限定是怎麼個限定法?連HTML都不給嗎?
作者: whs2009 (歐森)   2020-06-17 19:57:00
限定用IE開是因為和有ActiveX的元件還是server有方式辨識client端採用chrome而block呢? 如果是透過user-agent來block 其他瀏覽器可以嘗試去改chrome的user agent 或是 Window name來避開XD
作者: andrew43 (討厭有好心推文後刪文者)   2020-06-18 15:23:00
非IE但改過user-agent偽裝IE6/7也不行嗎?
作者: whs2009 (歐森)   2020-06-20 18:51:00
透過wdman package 的 IE driver 有辦法嗎

Links booklink

Contact Us: admin [ a t ] ucptt.com