[問題] 想請問在使用str_subset時\\.的功能

作者: a6409tw (爆蠑螈)   2018-02-26 23:18:42
[軟體熟悉度]:
入門(寫過其他程式,只是對語法不熟悉)
[問題敘述]:
最近正在練習使用R來爬蟲
但一直無法理解
str_subset(x,"\\.html")中\\.
我的理解是
左邊的\將右邊的\功能跳脫
使得結果變成在x中尋找符合\.html的元素
可是這樣.的功能並沒有被跳脫
一直都想不通
另外如果將程式碼改成
str_subset(x,".html")竟然跟
str_subset(x,"\\.html")的結果一樣
str_subset(x,"\\.html")的結果一樣
我已經徹底混亂了
拜託各位大大了QQ
[環境敘述]:
Win10 64bit Version 1.1.383
[關鍵字]:
正則表示法、爬蟲
選擇性,也許未來有用
作者: celestialgod (天)   2018-02-26 23:24:00
你試試看x 多放一個xhtml的元素,看這個會不會被抓.在regex裡面被當作萬用字元,不是原本的.請查regex
作者: cywhale (cywhale)   2018-02-27 00:23:00
\\. 就代表你真的要找dot 這個字符 而只有dot在regex當中代表可以match任何字元 所以.html 可以match xhtmlR中'\' blackslash本身就是特殊字符 所以需要'\\'escapebackslash 打錯字
作者: celestialgod (天)   2018-02-27 07:24:00
你試試看x 多放一個xhtml的元素,看這個會不會被抓.在regex裡面被當作萬用字元,不是原本的.請查regex
作者: cywhale (cywhale)   2018-02-27 08:23:00
\\. 就代表你真的要找dot 這個字符 而只有dot在regex當中代表可以match任何字元 所以.html 可以match xhtmlR中'\' blackslash本身就是特殊字符 所以需要'\\'escapebackslash 打錯字
作者: eric500g (魚頭)   2018-02-27 20:26:00
左邊\是strings的跳脫,右邊\是regex的跳脫
作者: eric500g (魚頭)   2018-02-27 12:26:00
左邊\是strings的跳脫,右邊\是regex的跳脫

Links booklink

Contact Us: admin [ a t ] ucptt.com