PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
R_Language
[問題] 無法爬含中文的網址
作者:
clansoda
(小笨)
2016-08-16 20:54:46
還真是有點抱歉,整天來問的不是資料分析都是爬蟲的問題
我今天遇到一個之前沒遇過的問題就是當網頁含中文的時候
xml裏頭GET是會發生一些怪怪的問題,我今天爬文章的時候發現
GET後得到的網頁content會是unknown的型態,而使用content以後
會得到RAW型態的資料,而不是nodeset型態,想請問如何解決這樣的問題呢
下面是一個範例網頁,http://goo.gl/cc7EAI
感謝各位回覆。
繼續閱讀
[問題] 資料篩選相關問題 多對多
f496328mm
[問題] 資料取用與轉換
psinqoo
[問題] text2vec 在windows中文顯示問題
taichi53719
[問題] 如何分開奇特符號
clansoda
[問題] kmeans 大數據 版本
f496328mm
[分享] colorout 套件分享 (在terminal下有色彩)
andrew43
[問題] mac write csv
isofjslk3ad
Re: [問題] 資料長<->寬變換
celestialgod
[問題] 資料長<->寬變換
DrRd
[問題] 關於使用text,label 最大值
SleepyChink
Links
booklink
Contact Us: admin [ a t ] ucptt.com