來源 BMJ
翻譯 阿金
審校 戚譯引
許多研究宣稱,解讀人工智能在解讀醫學影像方面具備和人類專家同等甚至更強的醫學影像能力。但是人類,BMJ 近期發表的解讀一篇綜述指出,這些研究質量堪憂,醫學影像有明顯的人類夸大成分,研究人員警告這危及上百萬患者的解讀生命安全。
他們的醫學影像發現表明許多這類研究的證據質量堪憂,強調了提高研究設計和報告標準的人類需求。
人工智能是解讀一個創新且發展迅速的領域,有望改善病患護理,醫學影像緩解醫療服務負擔過重的人類問題。深度學習則是人工智能的分支,在醫學影像領域展現了獨特的發展前景。有關深度學習的論文發表數量一直在增長,并且一些媒體在頭條進行報道,大力宣揚 AI 的能力優于人類醫生,為快速應用推波助瀾。但是實際上,這些研究的方法和偏倚風險尚未經過詳細檢驗。
為此,一支研究團隊回顧了過去十年內發表的研究成果,比較了深度學習算法和臨床專家解讀醫學影像的能力。他們發現,這其中只有 2 項合格的隨機臨床試驗,和 81 項非隨機研究。
在非隨機研究中,只有 9 項屬于前瞻性研究(隨著時間的推移,對個體進行追蹤和收集信息),并且只有 6 項在“現實世界”臨床環境中進行了測試。
在比較組中,人類專家的平均人數只有 4 人,而原始數據和代碼的獲取(以允許對結果進行獨立審查)受到嚴格限制。
超過三分之二(81 項中的 58 項)的研究被判定為存在高偏倚風險(研究設計存在問題,會影響結果),而對于公認的報告標準遵守情況常常很糟糕。
四分之三的研究(61 項)宣稱,人工智能的表現至少能與臨床醫生相提并論(甚至更優秀),但只有 31 項(38%)表明需要進一步的前瞻性研究或者試驗。
研究人員承認這篇綜述也存在一些局限,比如可能會有遺漏的研究,而且研究只關注深度學習醫學影像研究,所以結果可能無法應用于其他類型的人工智能。
無論如何,他們認為目前“存在許多明顯夸大的說法,宣稱人工智能的能力等同于(或者優于)臨床醫生,這在社會層面上給患者的安全和人口健康構成了潛在風險”。
他們還警告說:“過分夸大其詞的話語很容易讓媒體和公眾誤讀這些研究,結果可能會導致不恰當的護理手段,那不一定符合患者的最佳利益。”
“要最大限度地保護患者的生命安全,最好的辦法就是確保開發高質量、透明的報告證據庫,并繼續向前推進,”他們總結。
原文鏈接:
//eurekalert.org/pub_releases/2020-03/b-co032320.php
47MB
查看336MB
查看186MB
查看789MB
查看
網友評論
2365
2024-01-12 來自湖南 推薦
: 來自河北
: 來自安徽
: 來自甘肅
69498
2024-01-12 來自湖南 推薦
: 來自河北
: 來自安徽
: 來自甘肅
11222
2024-01-12 來自湖南 推薦
: 來自河北
: 來自安徽
: 來自甘肅
2
2024-01-12 來自湖南 推薦
: 來自河北
: 來自安徽
: 來自甘肅
642
2024-01-12 來自湖南 推薦
: 來自河北
: 來自安徽
: 來自甘肅