請教各位:
https://data.gov.tw/dataset/32500
本國專利技術名詞中英對照詞庫,可以從上面網址下載。檔案格式為xml,而且檔案很大
,約800mb。
我想把它下載下來,當作電腦中的字典使用。於是寫了兩組code。
第一組使用ET.iterparse;第二組使用ET.parse。
https://repl.it/@ides13chen/dictionary
書中寫說ET.iterparse使用的記憶體量比較小,但是我執行後查了電腦中的記憶體使用
量最後到達700mb,和預期的7mb差很多,是我哪裡做錯了嗎?
另外,run了這兩組code後,覺得有點慢。感覺xml格式不適合當字典使用?
如果轉成資料庫檔會比較快嗎?可以提供建議嗎?謝謝。