※ 引述《dummytrue (就只是大叔而已)》之銘言:
: 想要找目前做某個東西的論文中標題出現某個字的出現頻率
: 寫了一隻爬蟲(有用到selenium、BeautifulSoup)
: 結果NCBI會封ip
: 不知道有推薦其他方法的嗎?
NCBI 自己有出工具啊
E-utilities:
Web API,但是沒有包成 RESTful API,是老式的 web 呼叫
範例是用 Perl,但其實用其他 http clients 也可以
Python 的話推薦用 requests
Entrez Direct:
一組 Unix 命令列工具,將上述 web 呼叫包成命令列工具
同樣也是用 Perl 寫成;我試過,在類 Unix 系統才能使用
NCBI 一定會封 IP,不要浪費時間去試爬蟲