[問題] for迴圈搭配regex效率問題

作者: hateli (kk)   2019-02-22 11:01:42
小弟菜鳥 想詢問一下各位
目前寫的一個程式是要在2000篇文件中以regex找尋關鍵字出現與否 (以某些特徵出現)
而關鍵字的列表約有600萬個字
導致運算速率非常慢
如果想增進效率
不知能從什麼方面著手?謝謝
作者: shala (沙羅)   2019-02-22 11:25:00
列表內的項目有600萬個的意思?
作者: hateli (kk)   2019-02-22 11:29:00
是的 另外是字典不是列表 內文打錯了~
作者: w0005151 (藍廳)   2019-02-22 11:42:00
關鍵字彼此不會重疊嗎?可以試試看把常出現的放前面
作者: s860134 (s860134)   2019-02-22 12:10:00
丟平行?
作者: cutekid (可愛小孩子)   2019-02-22 12:55:00
FlashText
作者: AndCycle (AndCycle)   2019-02-22 15:51:00
哪種類型的文件? 單純txt的話直接換工具比較快
作者: TitanEric (泰坦)   2019-02-22 20:28:00
允許預處理嗎 先把單字在哪個文件那一行記起來 之後用regex搜
作者: hateli (kk)   2019-03-07 11:49:00
謝謝大家回答,最後用flashtest解決了,之前推文沒送出*text

Links booklink

Contact Us: admin [ a t ] ucptt.com