最近嘗試把新聞爬蟲做得系統化,也發現各新聞網站的技術問題
大致上整理了兩份表格,可以知道有哪些技術債還沒還
如果想去這些新聞媒體 coding 可以推測要拆的雷
https://github.com/virus-warnning/twnews/blob/feature/search-news/docs/SOUP_NOTES.md
如果覺得這爬蟲有用,也歡迎抓來玩玩
只要在 Python 3.5 以上這樣裝就可以了
pip3 install twnews
詳細請見
https://pypi.org/project/twnews/