作者:
tonglie (世界真奇妙)
2015-11-02 13:22:16小妹(想用關鍵字減少被批的情形XD)完全是與coding無關的財會背景
因緣際會之下聽聞了python可以下載網頁的數據庫
最近因為興趣想要做個副業來兼差
想要加速進貨速度(進貨來源目前是日本的雅虎拍賣)
朋友說python可以存取資料庫
原本想要花錢請人寫個程式
然後又聽另外的朋友建議有可能我買了一個程式
可能日本雅虎端那邊更改設定變成我程式只能用一次
才突發奇想想自己學寫看看(主要也是想省點錢囧)
後來上了cousera的課,但發現萊斯的課比較像教寫遊戲
因為毫無基礎,也很難從遊戲舉一反三變成資料庫存取
原本想報名台大的python課,想說有老師的話還可以順便偷問幾招額外的
但朋友一直用我根本不知道要學幾年才能學會爬蟲打壓我的信心QQ
叫我還是趕快找個專業人士合作比較實在(但我這idea這麼low怎麼吸引專業人士XD)
想問一下如果要自學的話,要達成上述目標我能做什麼呢?
實在沒有相熟的朋友是資工背景且嫻熟爬蟲的提供我協助
所以才想上版來請教大家
我有看一些書單,但也爬了很多文有說應該要再懂OOXX才可以XXOO
不曉得是否有熱心的版友讓我請教請教
謝謝大家
作者:
walelile (wakaka)
2015-11-02 14:42:00你的需求不用全部自己寫,有爬蟲套件scrapy
作者:
tonglie (世界真奇妙)
2015-11-02 15:15:00謝謝樓上再度指引!! 我真的太無知了什麼都不懂我再研究研究該套件內容QQQQQQ 感謝感謝
作者:
Neisseria (Neisseria)
2015-11-02 15:40:00作者:
tonglie (世界真奇妙)
2015-11-02 19:34:00謝謝N大:D!
跟你想的不太依樣 不是存取資料庫 只是抓資料下來另外就是 拍賣的東西 他設定的關鍵字很不一定所以跟你想的東西到最後會有誤差是一定的
作者:
bigpigbigpig (To littlepig with love)
2015-11-02 21:27:00我是用 lxml 模組啦,還蠻方便的,Google 一下吧 :)
作者:
tonglie (世界真奇妙)
2015-11-02 22:56:00喔喔 原來是這樣 我再研究研究 有誤差沒關係 因為一頁頁點真的好漫長囧> 才想說要怎麼提高效率謝謝b大M大的建議!
coursera有另一堂programming for everyone(Python)系列教的非常好
舉例來講 你去露天查"洛克人"就好了然後注意一樣商品 在去看同樣商品 其他賣家的描述你就會知道困難點在哪邊了...最終還是要回歸到人來辨識如果你是要固定同一個賣家 那就當我沒說
作者:
tonglie (世界真奇妙)
2015-11-03 11:00:00謝謝g大建議 來去看看該堂課 我這兩天也有看到python有門新課程 看起來似乎比較貼近我想做的事謝謝m大 其實我當初就是想說先下載下來再人工辨識每一樣商品 因為日本雅虎的商品量是台灣的好幾百倍了 滑鼠都點到要起火了XD 我會再試試看的 謝謝QQ (雖然那步可能還很遠 我現在連爬都不會爬 現在還很難想像障礙賽的未來
可不可以簡易敘述一下需求呢?說不定有適合度很高的套件可以用
作者:
Neisseria (Neisseria)
2015-11-03 20:59:00作者:
mirage7714 (C'est mon soeur.)
2015-11-03 22:26:00推programming for everyone的python課程 基礎教很多
作者:
jokebbs (bbs://)
2015-11-06 23:39:00推密西根大學的那個禿頭教授+1 講得很好
作者: Tr3e 2015-11-17 17:33:00
udacity的intro to CS就是用寫爬蟲來入門,你可以試試