使用的是 Python 3.4
字串格式如:
Ahearne M, 1999, INT J RES MARK, V16, P269, DOI 10.1016/S0167-8116(99)00014-2
欄位是以逗號分隔,所以資料分別為 author, year, paper, volumn, page, doi
因為有些資料會缺欄位(例如沒有year或volumn...)
所以用 str.split(',') 的話可能會有不同筆資料欄位不同的問題
paper 這個欄位一定是全部都大寫
因此想用正規式來抓取,但目前功力有限,
試了很久一直寫不出有效的規則
請各位高手指教