[問題] 字串段落尋找

作者: ffrr ( )   2014-04-10 11:35:37
請問版友 要怎麼取得Html文字中的某個區段內容
例如內容如下
<head>
<li><a href="#01">XXXXXX</a></li>
<li><a href="#02">YYYYYY</a></li>
</head>
<head>
<li><a href="#01">MMMMMM</a></li>
<li><a href="#02">NNNNNN</a></li>
</head>
要怎麼取得第二組head內中的資料,例如取得
<li><a href="#01">MMMMMM</a></li>
<li><a href="#02">NNNNNN</a></li>
目前的處理方式是用grep "MMMMMM" 跟grep "NNNNNN"
但是因為MMMMM跟NNNNN會變動,所以不好處理
想請問有沒有方式可以用<head>跟</head>當成標記
來處理字串的方式呢?
作者: x2006 (?)   2014-04-10 12:03:00
grep href=\"#0 filenamegrep href=\"#0[12] filenamesed -n '3,4p'
作者: rellik (( ̄▽ ̄#)﹏﹏)   2014-04-10 16:21:00
看看 grep -C 3 "MMMMMM" 能不能符合你的需求
作者: soem (流水)   2014-04-10 21:55:00
cat test.html | sed '1,/<\/head>/d'(承上) | sed -e '/^.*<head>/ d' -e '/<\/head>.*$/ d'
作者: cspy (Perfect Stranger)   2014-04-10 23:49:00
Awk 設定字首字尾
作者: ffrr ( )   2014-04-14 11:13:00
謝謝 版友們 ^_^

Links booklink

Contact Us: admin [ a t ] ucptt.com