作者:
why702 (Glory Glory ManU )
2017-12-05 22:32:54小弟初學python,
有寫一個某個股票網站的爬蟲,
希望跟各位前輩交流一下,
但是礙於這個網站會擋爬蟲,
所以我不敢把程式公開,
如果有人也有寫類似的爬蟲願意交流的嗎?
目前我的程式因為股票資訊太多,
如果要全部都爬會花超過13hr,
所以我閹割了一大部分,
保留我覺得比較重要的,
但是還是會花約3hr多
想看前輩是不是有比較好的方法願意交流
感謝
3小時好久… 覺得沒效率應該有像樓上講的API可以用沒有錯
作者:
why702 (Glory Glory ManU )
2017-12-06 00:53:00有現成的,有辦法把所需的數據給我自由運算的嗎?
作者:
neil987 (R5大小姐-EX人品崩壞)
2017-12-06 03:37:00stocktw
作者:
coeric ( )
2017-12-06 09:45:00是樓上說的這網站嗎?改天來挑戰看看~~
作者: wennie0433 2017-12-06 21:19:00
github twstock
作者:
why702 (Glory Glory ManU )
2017-12-07 00:31:00喔! 這個我看過,寫得很好,但是少了一些資訊,所以我只好自己爬
作者:
rexyeah (ccccccc)
2017-12-07 12:39:00很好奇為何爬3hr..我爬了8個頁面還加上運算後在googlesheet上紀錄,還做了樞紐與畫圖也不用3分鐘啊btw, 我只紀錄了14個指標啦
作者:
why702 (Glory Glory ManU )
2017-12-07 18:51:00因為那個網站把歷史數據全部放上去,讀取解析那海量數據花很多時間有興趣我可以把git給您參考,看有沒什麼建議?
可以學我把歷史資料爬完後,下來用SQL分析,快不少
作者:
why702 (Glory Glory ManU )
2017-12-08 18:53:00我就是這樣做沒錯,但還是每天要更新