PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] python抓網頁資料問題
作者:
sariel0322
(sariel)
2014-12-23 21:40:26
不好意思又來發問,而且這次不知道算不算純python問題
想請問一下,我用beautifulsoup來抓取網頁資料
想要抓的是這個網頁按下"perform"的資料
原本的網址:http://web.expasy.org/cgi-bin/peptide_mass/peptide-mass.pl?P35225
按下後會跑出這一類的資料
http://ppt.cc/xTj1
但是這些資料的網址卻變成:http://web.expasy.org/cgi-bin/peptide_mass/peptide-mass.pl
用beautifulsoup抓的時候就變成錯誤了,用這網址當然也不能用
想請問一下,我該怎麼抓附圖的資料
作者:
Seudo
(進擊的三笠)
2014-12-23 23:28:00
requests.post(url,data={'protein':'P35225'}).text
作者:
Thisisnotptt
(這不是PTT)
2014-12-23 23:55:00
http://pastebin.com/McZWCQq7
你試試看行不行,有用到mechanize套件送出相對應的POST他就會給你對的資料了
作者:
sariel0322
(sariel)
2014-12-30 23:36:00
好像不行...一樓可以讀,但是重要的table的資料出不來
作者:
Seudo
(進擊的三笠)
2014-12-31 17:49:00
form都填完就會有table資料了
http://pastebin.com/bXMu52QX
繼續閱讀
[問題] Django仿做網頁部分功能
tino9808
[閒聊] Rusthon
changyuheng
Re: [問題] 透過 Python 即時更新 Excel
largesperm
Re: [問題] 大量資料程式抓取
alibuda174
[問題] 大量資料程式抓取
sariel0322
Re: [問題]我寫的爬蟲只會爬到第一個符合條件的
Seudo
[問題]我寫的爬蟲只會爬到第一個符合條件的
elmo56
[問題]scrapy如何將item的資料成對的儲存起來?
allen511081
Re: [問題] function 的預設值
Seudo
[問題] function 的預設值
ql4au04
Links
booklink
Contact Us: admin [ a t ] ucptt.com