[問題] Regular Expressions Pattern的Capturing Groups問題

作者: d0068267 (WizXu)   2021-08-04 20:18:49
大家好,我是Java的菜雞,目前在學到Regular Pattern的地方
想請問正規表達式的問題,程式碼如下:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegexMatches {
public static void main( String args[] ) {
// String to be scanned to find the pattern.
String line = "This order was placed for QT3000! OK?";
String pattern = "(.*)(\\d+)(.*)";
// Create a Pattern object
Pattern r = Pattern.compile(pattern);
// Now create matcher object.
Matcher m = r.matcher(line);
if (m.find( )) {
System.out.println("Found value: " + m.group(0) );
System.out.println("Found value: " + m.group(1) );
System.out.println("Found value: " + m.group(2) );
}else {
System.out.println("NO MATCH");
}
}
}
我想請問的是Output的部分
Found value: This order was placed for QT3000! OK?
Found value: This order was placed for QT300
Found value: 0
為什麼"(.*)(\\d+)(.*)";
的m.group(1)是 This order was placed for QT300
就我目前的理解在API裡面查到的內容為
. Any character (may or may not match line terminators)
X* X, zero or more times
X+ X, one or more times
\d A digit: [0-9]
.是任何字元、\\d是數字
那麼digit不是從3開始到300,也就是
m.group(1):This order was placed for QT
m.group(2):3000
m.group(3):! OK?
為什麼跟我想的不一樣,是我誤會(.*)(\\d+)(.*)的意思嗎?
作者: jej (晃奶大馬桶)   2021-08-04 20:33:00
要搭配服用.find()和.matches() 等method的文件服用
作者: wxyy   2021-08-05 13:20:00
String pattern = "(.*?)(\\d+)(.*)";加個問號 就是你要的結果你可以下 regex greedy 這兩個關鍵字去查資料
作者: ssccg (23)   2021-08-05 16:27:00
.是任何字元,不就包含數字,300可以是.*的部分也可以是\d+的部分啊,你要先意識到這點再看下去再來才是300會歸給哪部分,就是2樓提的比對模式的差別但是如果你的原意是前面的.*只包含非數字部分,何不一開始就排除數字,不要用.*,用\D*

Links booklink

Contact Us: admin [ a t ] ucptt.com