[問題] 爬蟲 Beautifulsoup4 一些小困難

作者: asd860079 (U戲boy)   2017-10-05 06:29:14
大家好,小弟算python新手
爬蟲和寫稍微有點規模的python小程式都是第一次
遇到了一點小問題所以上來請教
今天我試著想要抓取LOL game history的一些數據
透過Json把下面static的部分抓完了
但還是有些資訊沒包刮在那份Json裡面
所以還是想說回到一開始的方法 去抓顯示頁的資訊
最後在抓英雄名稱的時候遇到了一點問題
如圖,我的程式碼和輸出結果長這樣
https://imgur.com/1kJzxTM.jpg
我最多只能抓到這樣
但是我只想要 'data-rg-id'後面的英雄名而已
其他還試過item.select('data-rg-id') ...等等自己憑感覺亂打的一些code
但不是error就是 空白 (沒有print出任何東西)
print出20個空list[] 好像是最接近的了(?
https://imgur.com/LVg5qdJ.jpg
這個是主要的問題
還有一個小問題就是有沒有其他寫法可以優化執行的速度 XD
因為上面這樣console出來都要花個30秒左右
好像稍嫌慢了一點(?
以上,還請各位大大不吝賜教
小弟第一次在本版發文,如有違規或不妥還請告知
作者: coeric ( )   2017-10-05 08:11:00
頁面?
作者: lizkarina (lizka)   2017-10-05 15:34:00
Attribute selectors 看一下吧。https://goo.gl/ai2fj

Links booklink

Contact Us: admin [ a t ] ucptt.com