[問題] 關於標記出指定字串的問題

作者: banana2014 (香蕉共和國)   2015-06-06 21:22:52
我希望用PHP來標記(highlight)出指定的字串,其中當遇到「HTML實體」時要特別小心,
因為當指定的字串($search_txt)是分號(;)時,可能連HTML實體的末端字元也會一起被標
到,而這不是我想要的結果,於是我自己寫了以下的程式:
http://www.red-whale.com.tw/test/PHP-test/index.phps
發現還挺不賴的,但是摸到最後還是發現的一些問題:
當$search_txt="a&ffg";時,理應要在content中間highlight出該字串出來,但是它
卻沒有標出來。我原先的步驟是:先將HTML實體以外的字串拆開成許多小節(分散在陣列
中),在各小節搜尋並highlight含有$search_txt的字串。再來將各節的HTML實體一一拿出
來檢驗是否與$search_txt相等(因為$search_txt本身也有可能是一個HTML實體),若有也
highlight它。但萬萬沒想到還有一個case,那就是若$search_txt當中若同時含有HTML實
體和其他字元那該怎麼辦? 這就讓我頭大了,請各位幫幫我怎麼解決這個問題,謝謝。
作者: banana2014 (香蕉共和國)   2015-06-06 21:29:00
註:content裡的內容都已經事先htmlspecialchars了
作者: LPH66 (-6.2598534e+18f)   2015-06-07 03:58:00
我覺得你要反過來想, 你要標示的是顯示出來的字串那麼你應該要先解掉 htmlspecialchars 再做搜尋或者如果你有原始字串的話, 先標出來再上 htmlspecialchars
作者: banana2014 (香蕉共和國)   2015-06-07 09:46:00
但是程式如果先標記再做htmlspecialchars的話,連<font color=red><b>...</b></font>這些標籤也會被一併轉換成HTML實體,所以順序上是不能改變的
作者: Darkland (小黑XDrz)   2015-06-07 17:29:00
如果 search_txt 也是已經 htmlspecialchars 的狀態了直接用一行 str_replace 會有什麼問題嗎@@
作者: banana2014 (香蕉共和國)   2015-06-07 19:12:00
當$content="abc&amp;ggf";且$search_txt="mp;ggf"時照理來說不應該做任何標記(因為顯示出來的畫面結果第一個變數($content)會是:「abc&ggf」,而第二個變數($search_txt)會是:「mp;ggf」,顯然第一個變數字串沒有包含第二個變數字串),但是如果用str_replace的話就會變成「mp;ggf」標紅字了,整體的HTML碼會變成「abc&a<font color=red><b>mp;ggf</b></font>」,而這不是我想要的結果總而言之,把HTML實體看作是一個字,不要被其他片段的字一起給標記住了
作者: bibo9901 (function(){})()   2015-06-07 21:02:00
先html_entity_decode?

Links booklink

Contact Us: admin [ a t ] ucptt.com