[問題]正則表達式找出之資料全部都分割

作者: swwy1661 (小玉米)   2019-11-07 16:48:28
大家好,小弟是自學python,上來問問題
基礎不好,請大家見諒
直接上代碼
import re
page_source =
'MDCore||s|d1354d3800dd8e659acca9f54dab450f|delivery1|mixdrop|co|referrer|thumbs|jpg|vsrc|mp4|v|gQVGA8SHsiXubSB6sfcaVQ||1573136954|'
req = "s|(.*?)|deliveryt"
#
results = re.findall(req,page_source)
#
print(results)
以上是小弟的代碼,page_sourece是小弟用selenium抓取下來的原始碼其中一段需要之內容
使用re(正則表達式),想提取出d1354d3800dd8e659acca9f54dab450f這段數值
但結果打印出來卻變成['', 'M', '', 'D', '', 'C', '', 'o', '', 'r', '', 'e', '', '|', '', '|', '',
'', '|', '', 'd', '', '1', '', '3', '', '5', '', '4', '', 'd', '', '3', '',
'8', '', '0', '', '0', '', 'd', '', 'd', '', '8', '', 'e', '', '6', '', '5',
'', '9', '', 'a', '', 'c', '', 'c', '', 'a', '', '9', '', 'f', '', '5', '',
'4', '', 'd', '', 'a', '', 'b', '', '4', '', '5', '', '0', '', 'f', '', '|',
'', 'd', '', 'e', '', 'l', '', 'i', '', 'v', '', 'e', '', 'r', '', 'y', '',
'1', '', '|', '', 'm', '', 'i', '', 'x', '', 'd', '', 'r', '', 'o', '', 'p',
'', '|', '', 'c', '', 'o', '', '|', '', 'r', '', 'e', '', 'f', '', 'e', '',
'r', '', 'r', '', 'e', '', 'r', '', '|', '', 't', '', 'h', '', 'u', '', 'm',
'', 'b', '', '', '|', '', 'j', '', 'p', '', 'g', '', '|', '', 'v', '', '',
'r', '', 'c', '', '|', '', 'm', '', 'p', '', '4', '', '|', '', 'v', '', '|',
'', 'g', '', 'Q', '', 'V', '', 'G', '', 'A', '', '8', '', 'S', '', 'H', '',
'', 'i', '', 'X', '', 'u', '', 'b', '', 'S', '', 'B', '', '6', '', '', 'f',
'', 'c', '', 'a', '', 'V', '', 'Q', '', '|', '', '|', '', '1', '', '5', '',
'7', '', '3', '', '1', '', '3', '', '6', '', '9', '', '5', '', '4', '', '|',
'']
查了資料,也不知道這是哪裡出了問題,只好上來提問
再麻煩大家了,謝謝。
作者: geniusofgod (Pad0)   2019-11-07 17:16:00
results = page_source.split('|')[3]如果不一定要用regex分出來的話 可以這樣
作者: GeoMeTric ( )   2019-11-07 18:51:00
| 是有其用途的特殊字元。
作者: MARGHT   2019-11-07 19:22:00
“.*?\|s\|(\w+)\|.*”
作者: s860134 (s860134)   2019-11-08 23:39:00
同樓上 \ 跳脫
作者: swwy1661 (小玉米)   2019-11-09 11:46:00
上述的方法都可解決 ,謝謝以上大神唷,感謝

Links booklink

Contact Us: admin [ a t ] ucptt.com