[討論] 股票爬蟲

作者: why702 (Glory Glory ManU )   2017-12-05 22:32:54
小弟初學python,
有寫一個某個股票網站的爬蟲,
希望跟各位前輩交流一下,
但是礙於這個網站會擋爬蟲,
所以我不敢把程式公開,
如果有人也有寫類似的爬蟲願意交流的嗎?
目前我的程式因為股票資訊太多,
如果要全部都爬會花超過13hr,
所以我閹割了一大部分,
保留我覺得比較重要的,
但是還是會花約3hr多
想看前輩是不是有比較好的方法願意交流
感謝
作者: cocoaswifty (coco)   2017-12-05 23:40:00
股票程式交易不都有API可以用,為什麼要爬
作者: TitanEric (泰坦)   2017-12-06 00:05:00
3小時好久… 覺得沒效率應該有像樓上講的API可以用沒有錯
作者: why702 (Glory Glory ManU )   2017-12-06 00:53:00
有現成的,有辦法把所需的數據給我自由運算的嗎?
作者: neil987 (R5大小姐-EX人品崩壞)   2017-12-06 03:37:00
stocktw
作者: coeric ( )   2017-12-06 09:45:00
是樓上說的這網站嗎?改天來挑戰看看~~
作者: wennie0433   2017-12-06 21:19:00
github twstock
作者: why702 (Glory Glory ManU )   2017-12-07 00:31:00
喔! 這個我看過,寫得很好,但是少了一些資訊,所以我只好自己爬
作者: rexyeah (ccccccc)   2017-12-07 12:39:00
很好奇為何爬3hr..我爬了8個頁面還加上運算後在googlesheet上紀錄,還做了樞紐與畫圖也不用3分鐘啊btw, 我只紀錄了14個指標啦
作者: why702 (Glory Glory ManU )   2017-12-07 18:51:00
因為那個網站把歷史數據全部放上去,讀取解析那海量數據花很多時間有興趣我可以把git給您參考,看有沒什麼建議?
作者: koshi0413 (Koshi)   2017-12-07 20:19:00
可以學我把歷史資料爬完後,下來用SQL分析,快不少
作者: why702 (Glory Glory ManU )   2017-12-08 18:53:00
我就是這樣做沒錯,但還是每天要更新

Links booklink

Contact Us: admin [ a t ] ucptt.com