[新聞] 失智症檢測不及格！較老的AI模型表現出 Clarkliu PTT批踢踢實業坊

[新聞] 失智症檢測不及格！較老的AI模型表現出

作者: Clarkliu (noname) 2025-02-17 10:38:26

https://udn.com/news/story/6812/8552573
失智症檢測不及格！較老的AI模型表現出認知受損跡象
經濟日報／編譯季晶晶／綜合外電
根據英國醫學期刊（BMJ）2024年12月20日刊出的研究論文，大型語言模型（LLM）和聊天
機器人等人工智慧（AI）技術，也像人一樣，會因為年齡，出現認知能力退化的跡象。這
表示，即使醫療診斷愈來愈常仰賴AI，在肉眼明顯察覺之前，快速有效地從病歷、X光片
和其他資料裡發現異常，但AI還不能很快地取代真人醫生。
科學家使用「蒙特婁認知評估」（MoCA）來測試市面上公開的、由LLM驅動的聊天機器人
，包括OpenAI的ChatGPT、Anthropic的Sonnet，以及Alphabet的Gemini。MoCA是專用來檢
測老年人早期癡呆或認知受損的工具，滿分30分，人類受測者26分以上代表合格，認知無
障礙。
對大多數LLM來說，它們在命名、專注力、語言能力和抽象概念等測試的某些方面看起來
很輕鬆，但在視覺空間建構和執行功能的表現都不好，有幾個在延遲記憶比其他LLM表現
更差。
至關重要的是，雖然ChatGPT最新版本（第4版）得分最高（30分裡獲26分），但較舊的
Gemini 1.0僅得16分，導致了「較舊LLM出現認知能力衰退跡象」的結論。
這些發現挑戰了AI將很快取代人類醫生的假設。具體而言，研究作者反對在需要視覺抽象
思維和執行功能的任務中使用AI，「領先的聊天機器人身上認知能力受損明顯，可能影響
它們進行醫療診斷的可靠性，並削弱患者信心。」
根據研究作者，他們的發現僅僅是觀察性的，AI與人類心智運作方式的關鍵差異意味實驗
無法構成直接的比較。但他們警告說，這可能是給AI臨床醫學應用踩煞車的「重大弱點」
。

繼續閱讀

[問卦] 表哥獨子還沒傳宗接代為什麼不去聯誼？ppp123 [問卦] 有關農作旁邊的白鷺鷥crystalvue Re: [問卦] 有錢但超摳的人到底在想啥dufo [新聞] 主導議題朱立倫今啟動能源戰場assxass [問卦] 覺得韓國酒駕社死如何？sf910132 [問卦] 台灣鋼鐵股跟烏克蘭重建有屁關係？？ncc5566 Re: [問卦] 丁特用虛擬貨幣比喻代儲詐騙？xox5678 Re: [問卦] 一般人買機械鍵盤算智商稅嗎？neil136 Re: [新聞] 川普警告：若哈瑪斯不釋放人質「地獄將morris [問卦] 今日烏克蘭，明日台灣？lovedls

[新聞] 失智症檢測不及格！較老的AI模型 表現出

[新聞] 失智症檢測不及格！較老的AI模型表現出