作者: losepacific (Losepacific) 2015-07-03 00:22:00
find . -regextype egrep -regex \'..*[^a-zA-Z0-9_-.)( /][^a-zA-Z0-9_-.)( /]*..*'剛剛測試find的正規表示,寫了這麼長才抓到直中文名中文檔名改碼或許可以找找關鍵字urlencodepython2 -c "import urllib, sysprint urllib.quote(sys.argv[1])" 4567889-我.txt在utf8環境下會輸出4567889-%E6%88%91.txtperl -MURI::Escape -e 'printuri_escape($ARGV[0])."\n";' "123-稍快.txt"2> /dev/null在utf8環境下會輸出123-%E7%A8%8D%E5%BF%AB.txt
作者:
bitlife (BIT一生)
2015-07-03 11:13:00你的linux有原生支援中文嗎? 原則上在中文utf-8環境,句點可以match中文,那些亂碼已不是中文字,所以.只能match一字元另外你的第2個regex,有greedy的問題,要使用修飾,我比較熟程式語語用的regex, command line的不是很確定抱歉,我看錯了,上面15,16分的推文請忽略