※ 引述《Lordaeron (Terry)》之銘言:
: : 後面那兩個是不是真的就快我不太確定,只是有文件宣稱,我沒用過。
: Python vs
: perl
: http://benchmarksgame.alioth.debian.org/u64q/perl.php
: java
: http://benchmarksgame.alioth.debian.org/u64q/python.php
......
: 純比較,有興趣的人自已玩玩吧.
岔回原文好了。我不太想提別人的成功案例多漂亮,因為那些案例是累積了多少
個人的多少個人時做出來的。而你我呢,一天頂多8個人時。
我用python工作並且製作產品,最爽的部分就在於XML的處理。我要處理的XML檔案
動則上GB的尺寸。XML規格不詳,只能看情況,一件歸一件。主要的處理方式,是
自己定義需要截取哪些欄位資料,拿出來另存為CSV。
path = []
for event, node in xml.etree.ElementTree.iterparse(File,
events=('start', 'end')):
if node == 'start':
path.extend([node.tag])
if node == 'end':
if '/'.join(path) == 'xxx/yyy/zzz':
yield take_values(node)
path = path[:-1]
node.clear()
以上述的程式為核心,寫出來之後交出去。交出去的東西,就是所謂「產品」。
這樣,需求滿足,他高興,我也高興,程式也不會因為資料太大就當掉。
當然這是所謂的「另存新檔」的類型,是IO-bound,但不算資料分析,
效能方面,就給他用線性速度就能接受了。有什麼不滿意嗎?
沒什麼不滿意的,因為,這是工作,而不是我個人的作品。
我覺得,就好像在機車行修車,就好好修車,不要幻想你修過的引擎會升級為
噴射機的引擎。