PTT
Submit
Submit
選擇語言
正體中文
简体中文
PTT
Python
[問題] for迴圈搭配regex效率問題
作者:
hateli
(kk)
2019-02-22 11:01:42
小弟菜鳥 想詢問一下各位
目前寫的一個程式是要在2000篇文件中以regex找尋關鍵字出現與否 (以某些特徵出現)
而關鍵字的列表約有600萬個字
導致運算速率非常慢
如果想增進效率
不知能從什麼方面著手?謝謝
作者:
shala
(沙羅)
2019-02-22 11:25:00
列表內的項目有600萬個的意思?
作者:
hateli
(kk)
2019-02-22 11:29:00
是的 另外是字典不是列表 內文打錯了~
作者:
w0005151
(藍廳)
2019-02-22 11:42:00
關鍵字彼此不會重疊嗎?可以試試看把常出現的放前面
作者:
s860134
(s860134)
2019-02-22 12:10:00
丟平行?
作者:
cutekid
(可愛小孩子)
2019-02-22 12:55:00
FlashText
作者:
AndCycle
(AndCycle)
2019-02-22 15:51:00
哪種類型的文件? 單純txt的話直接換工具比較快
作者:
TitanEric
(泰坦)
2019-02-22 20:28:00
允許預處理嗎 先把單字在哪個文件那一行記起來 之後用regex搜
作者:
hateli
(kk)
2019-03-07 11:49:00
謝謝大家回答,最後用flashtest解決了,之前推文沒送出*text
繼續閱讀
[問題] heroku+django休眠問題
as30385438
[討論] Python語法是不是不太嚴謹?
zo6596001
[教學] 互動式圖片 - Bokeh
brad0315
[問題] Python 偵錯中修改程式碼
nevikw39
Re: [問題] 請教如何背景執行?
rexyeah
[問題] 請教如何背景執行?
Sagbtoautumn
[心得] 分享 金融開源data package
f496328mm
[問題] 安裝CUDA 9.0 遇到問題
sssh
[問題] 新手求助安裝套件相關問題
Curson
[問題] 請問tensorflow動態訓練模型怎麼輸出
stst82431
Links
booklink
Contact Us: admin [ a t ] ucptt.com