肺癌預測的人機對決 谷歌AI贏過6位放射專家
https://bit.ly/2MeZSxX
鏡週刊 2019年5月25日 上午6:05
人機對決的主角已經不再限於谷歌的 AlphaGo 。
5 月 20 日,《自然-醫學》報道了來自谷歌 AI 團隊的一項人工智能研究,這是根據低
劑量計算機斷層掃描圖像來預測肺癌的。其結論是,AI 表現超越了 6 位專業的放射醫學
專家。
4D預測肺癌
2018 年,全世界有 960 萬人死於癌癥,其中肺癌死者就有 176 萬,高居癌症死亡率第
一位。在中國,由於人口老齡化和空氣汙染的嚴重態勢,且吸煙率居高不下,肺癌也已成
為死亡率最高的惡性腫瘤。據《中國肺癌低劑量螺旋 CT 篩查指南( 2018 年版)》,在
2015 年,中國肺癌的發病和死亡例數分別達 73萬 和 61 萬,發病率和死亡率非常接近
,其主要原因是臨床診斷病例多已為晚期,失去了手術機會。
早期診斷和早期治療是提高肺癌生存、降低肺癌死亡率的重要措施。在高危人群中,與
X 線胸片比較,低劑量電腦斷層掃描( LDCT )可降低 20% 的肺癌死亡率。2013 年,
美國預防醫學工作組( USPSTF )推薦對高危人群進行低劑量電腦斷層掃描篩查肺癌。
不過今天也只有 2% 到 4% 的符合條件的美國患者進行了篩查。谷歌產品經理 Lily
Peng 博士指出,早期的微小腫瘤很難看到,超過 80% 的肺癌病例無法及早發現。
肺部影像的評估是基於圖像中肺部的結節大小、密度和生長情況,但是假陰性和假陽性會
導致很多不必要的活檢與漏診,於是大量肺癌在發現時已是晚期,這帶來高昂的臨床成本
和經濟成本。
目前美國食品藥品監督管理局(FDA)已經批準了一些軟件應用,這些應用主要是為醫學
成像專家提供特定圖像的診斷支持,屬於電腦輔助檢測範疇。
為了超越先前電腦輔助檢測方法的局限性,來自谷歌 AI 部門的 Daniel Tse 及同事建立
了一種端到端的分析方法,僅使用輸入 CT 圖像就可以來預測肺癌風險。此外,他們還使
用卷積神經網絡(CNN)來進行訓練,這種技術在圖像識別方面能夠給出更好的結果。
放射科醫生無法像電腦一樣檢查 3D 掃描,他們必須審查數百個單獨的 2D 掃描切片以發
現問題,而腫瘤可能會很微小以至難以察覺,這種新的機器學習系統則可以分析高通量的
3D 肺部圖像,不僅可以對整體腫瘤進行預測,還可以通過肺結節識別細微的惡性組織。
再加上先前的掃描數據對比,就可以用來評估肺結節的生長速度。
論文共同作者、美國西北大學醫學院 Mozziyar Etemadi 博士說,3D 檢測早期肺癌的能
力比人眼檢測 2D 圖像要敏感得多。事實上,新系統在技術上可以納入 4D 範疇,因為它
不僅僅是一次 CT 掃描,而是包括了當前和先前共計兩次的掃描,所以可以檢測肺結節隨
時間的生長變化。
在這項研究中,谷歌的 AI 算法至關重要。當然,這也受益於谷歌強大的計算機運行能力
。
Daniel Tse 團隊用 42290 張 CT 掃描圖像進行訓練,以便在無人類參與的情況下預測肺
結節的惡性程度。他們發現,在 6716 個測試病例中,該人工智能系統能夠以 94% 的準
確率發現極小的惡性肺結節。在無先前 CT 掃描圖像的情況下,該系統的表現超越所有
6 位放射醫學專家,假陽性減少 11% ,假陰性減少 5% ;而在有先前 CT 掃描圖像的
情況下,兩者表現不相上下。這 6 位放射專家有平均 8 年( 4 年到 20 年)的讀片經
驗。
2019 年 5 月 7 日,Lily Peng 在 2019 年開發者大會上稱,他們研發的人工智能技術
可以比醫生早一年查出肺癌,使患者存活的概率提升 40% 。
開發人工智能系統的谷歌工程師強調,它不是為了取代放射科醫生,而是為了提高醫生檢
測結節的能力並確定它們是否有危險。作者提醒說,這些發現還需要經過大規模的臨床驗
證,但現有研究,仍說明這一模型有望推動改善肺癌患者的管理和預後。
鑒於專業的胸透放射醫生缺乏,谷歌這個新系統對於社區醫院的普通放射科醫生將會是一
個便捷工具,這可能會成為肺癌篩查推廣的利器。
不僅僅是輔助檢測
那麽,這個系統能否達到 100% 的肺癌預測率呢?他們下一步有什麽規劃呢?對此,這項
研究的負責人 Daniel Tse 接受了 DeepTech 的專訪。
DeepTech:這項研究方法的特點是哪些呢?
Daniel Tse:今天的肺癌篩查存在若干挑戰,包括高頻率的假陽性和假陰性、評估者差異
可變性(inter-grader variability)以及實施廣泛成像篩查計劃的現實障礙。這些弊端
就給 AI 留下了施展拳腳的空間。深度學習方法可以進行覆雜的自動化圖像分析,檢測細
微的圖像變化以及統一圖像評估方法。
我們的模型結合了檢測和診斷雙重功能,並且經過深度學習算法,擁有計算機輔助檢測所
不能進行的解釋功能。這套系統可以使用患者當前和先前的 3D CT圖像來預測肺癌發展。
DeepTech:AI 的肺癌評估準確率有極限嗎?現在是 94% 的準確率,那麽是不是意味著還
有接近 6% 的提升空間?
Daniel Tse:目前的研究主要目的是為了創建深度學習的模型,且可以解決目前肺癌篩查
中的高假陽性和高假陰性問題。而現實應用中,總會有一些限制因素,這就使得 AI 不能
得到 100% 的精確度。
事實上,AI 並不以精確度為唯一追求,而是兼顧特異性(假陽性)和敏感性(假陰性)
。基於對實際結果的意義,後兩者的重要性可能不同。比如,減少假陰性意味著將檢測到
更多的癌癥,也就減少漏診。
下一步,我們的系統要給醫生提供這些預測結論的表述方式,以及給患者提供積極的建議
。
DeepTech:下一步會如何推進大規模臨床驗證?在將來如何推進這方面研究的產品化?
Daniel Tse:目前這些結果令人鼓舞,但還是早期階段。我們需要進一步改進和驗證這套
系統,並探索放射科醫生更實用的使用方法。此外,還要與世界各地的監管機構合作,確
保產品應用前有充分的研究。
DeepTech:谷歌 AI 部門之前在視網膜病變和乳腺癌方面都有很重要的工作,這些產品有
哪些進展?目前你們在這方面的工作與美國 FDA 有溝通嗎?
Daniel Tse:我們的大部分工作仍處於研究階段,但我們與谷歌旗下子公司
Verily-Alphabet 合作的糖尿病視網膜病變計劃現已部署在印度的診所。這也得到了歐
洲的健康、安全和環保的CE認證。我們正在與 FDA 進行研發產品的溝通。
在印度,7200 萬糖尿病患者中只有 600 萬人有機會接受糖尿病視網膜病變篩查,他們的
眼科醫生缺口超過 10 萬名。在過去 3 年中,我們開發了一種機器學習算法,更容易篩
查糖尿病性視網膜病變(DR)和糖尿病性黃斑水腫(DME)。
2018 年年末,我們在泰國也開展了這項工作。今年我們會在全球開展更多工作。
業內點評
關於這篇文章,DeepTech 也專訪了醫學成像國際權威、美國倫斯勒理工學院講席教授王
革。
「低劑量 CT 檢查對於肺癌普查極為重要」 王革說,「在這個領域人工智能 AI 方法大
有作為。若干團隊都先後獨立報告了令人鼓舞的結果,而這篇文章是一個傑出的代表。」
王革讚同 Daniel Tse 的觀點,這些結果還在早期階段。如何改進、優化和驗證,以及如
何融入放射科醫生的工作流程、如何實現可解釋性等方面均有大量的工作要做。他最後強
調,「人工智能 AI 是新的範式,道路曲折,前景光明。必將顯著提高醫療質量,造福民
眾。」
《麻省理工科技評論》發表評論認為,這些研究雖然是令人興奮的,但應該被視為小的進
步。因為出於隱私原因,在醫療保健中使用 AI 仍然具有挑戰性。此外,現實世界的數據
集很少像研究中使用的那樣完美。
值得註意的是,治療癌症不僅僅涉及檢測。例如,患者與患者之間多種因素的差異使得診
治難以完全實現自動化。
不過,紐約時報提出了疑問:如果這套 AI 系統得到 FDA 的批準,那麽隨著系統經驗和
更多數據的更新,開發商是否需要再次提交申請?如果是這樣,多久提交一次呢?