小弟有寫一個 parse web ptt 推文統計的服務給鄉民使用,
這一陣子有人反應統計後的數量不太對,
不過因為工作也忙, 所以沒太仔細看.
今天早上稍微看了一下才發現, 原來是有些推文似乎被當作電子郵件
因為目前分隔符號使用 @, 所以有好幾個推文都變成了 [email protected],
而且 parse 回來的內容有些也會自動被轉換成那樣的格式,
即使網頁上看到的是正常的.
目前災情實際狀況的連結:
https://www.ptt.cc/bbs/LoveLive_Sip/M.1493798864.A.36B.html
而被轉換過後的選項點下去後連到這邊
https://www.ptt.cc/cdn-cgi/l/email-protection
而裡面有一段是這樣的
You must enable Javascript in your browser in order to decode
the e-mail address.
從這看起來似乎有辦法在前端就 decode 了,
所以想請問一下有人實作過這一段嗎? 如果沒辦法就只好換個分隔符號了 囧rz