使用語言:Python 3
使用環境:Windows 10
我想製作一個小工具,檢查公司所需的文章,其格式是否存在一致性
其中一個格式是,阿拉伯數字必須要加千分位,
例如:123,000元(正確)、123000元(錯誤)
我知道在這條件下,正確的數字格式應該是:r'\d{1,3}(,\d{3})*(\.\d)?'
可是我現在想要做的是反過來,
就是檢查時,遇到不符合的數字就要標記起來,再以人眼確認
以免誤修到原本就不是用來表示數值的阿拉伯數字,如西元年份
我想到的條件很簡單,
就是只要連續四個以上的阿拉伯數字但中間沒逗號就是有嫌疑,所以寫r'\d{4,}'
我想請教的是,有沒有辦法用一條表達式,
在不根據數字後面的文字是年份或貨幣判斷下,
把至少1900~2099年間的西元年份給排除掉
因為每篇文章要檢查的條件可能高達千種以上,每種都要用一條表達式檢查
數字的千分位格式只是其中一個規定,
所以我希望,不到最後一刻別用if條件判斷式去排除西元年份,以免可讀性變差
才想說看能否整合成一個表達式