小弟我想要抓取一個具有固定class的div裡面所有的東西
而因為網頁不同,這個div標籤裡頭也有數量不一的其他的div標籤
為了避免截斷在錯誤的結尾標籤,我的想法是將裡面的div標籤都配對
也就是每碰到一個<div>就配給一個</div>,直到碰到對的那個
再經過各種亂湊(?)實驗之後
最成功的是下面這個
/<div class="c_1"[\s\S]+?>(?:(?:<div[\s\S]+?>[\s\S]+?<\/div>)*[\s\S]+?)+?<\/div>/
雖然實驗成功了,不過還是想請問一下
這樣的寫法會有什麼不好的bug嗎?
有什麼需要改進的地方呢?
或是有更簡潔的方式達到我的需求呢?