2分鐘內(nèi)出結(jié)果!準(zhǔn)過人類醫(yī)生!這款心臟檢測(cè)AI試驗(yàn)結(jié)果亮眼

以下文章來源于:藥明康德

人工智能(AI)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用一直備受關(guān)注。尤其是在分析醫(yī)學(xué)影像圖片方面,AI很早就被開發(fā)用于該領(lǐng)域。在今年的歐洲心臟病學(xué)會(huì)年會(huì)(ESC 2022)上,來自西達(dá)賽奈(Cedars-Sinai)醫(yī)學(xué)中心Smidt心臟研究所的心臟病學(xué)家David Ouyang教授分享了一項(xiàng)前瞻性雙盲試驗(yàn),該研究在真實(shí)的臨床環(huán)境中將AI模型與超聲醫(yī)師對(duì)經(jīng)胸超聲心動(dòng)圖評(píng)估的結(jié)果進(jìn)行了比較,結(jié)果顯示,就連經(jīng)驗(yàn)豐富的心臟病學(xué)家都無法區(qū)分哪些結(jié)果是經(jīng)“AI之手”得出的,哪些結(jié)果是來自于人類臨床醫(yī)生的判斷。此外,相比于人類臨床醫(yī)生的初始評(píng)估結(jié)果,AI生成的結(jié)果需要專家校正的比例更少。


該研究中使用到的AI模型EchoNet-Dynamic是一種利用多個(gè)心臟周期的超聲心動(dòng)圖視頻進(jìn)行訓(xùn)練的深度學(xué)習(xí)算法。在此前的研究中,該模型在分割左心室、估計(jì)射血分?jǐn)?shù)和評(píng)估心肌病等關(guān)鍵項(xiàng)目中的表現(xiàn)超過了人類專家,在左室射血分?jǐn)?shù)(LVEF)的評(píng)估方面,平均絕對(duì)誤差僅為4.1-6.0%。

微信圖片_20220905151748.png


在此次進(jìn)行報(bào)告的EchoNet-RCT試驗(yàn)中,研究人員將3495例經(jīng)胸超聲心動(dòng)圖按1:1的比例隨機(jī)分配給AI模型或平均擁有14年以上經(jīng)驗(yàn)的超聲醫(yī)師進(jìn)行初步評(píng)估,記錄的報(bào)告內(nèi)容包括LVEF的第一次讀數(shù)或是將血液泵出到身體其余部分的心肌強(qiáng)度數(shù)據(jù)。隨后,研究人員把AI模型和超聲醫(yī)師的報(bào)告混合后提交給資深心臟病學(xué)家進(jìn)行最終的審評(píng)。

研究發(fā)現(xiàn),與人類臨床醫(yī)生相比,心臟病專家對(duì)AI模型生成的報(bào)告進(jìn)行的校正較少——AI組僅有16.8%的報(bào)告與心臟病專家評(píng)估的LVEF相比具有實(shí)質(zhì)性的變化(數(shù)據(jù)差異>5%),而超聲醫(yī)師組的這一數(shù)據(jù)為27.2%。此外,即使是需要進(jìn)行校正的數(shù)據(jù),AI模型做出的即時(shí)讀數(shù)相比于人類醫(yī)生也更接近標(biāo)準(zhǔn)值。AI模型校正射血分?jǐn)?shù)讀數(shù)大部分在2.8個(gè)百分點(diǎn)以內(nèi),而人類醫(yī)生的校正射血分?jǐn)?shù)讀數(shù)平均在3.8個(gè)百分點(diǎn)。最重要的是,AI模型平均在2分鐘內(nèi)就能完成對(duì)一名患者的讀數(shù),在效率方面也十分出色。

有趣的是,研究人員還要求參與的心臟病學(xué)家猜一猜手上的這份報(bào)告究竟是出自人類還是AI之手。從結(jié)果上來說,AI做出的報(bào)告足以“以假亂真“。心臟病學(xué)家只猜對(duì)了其中三分之一的報(bào)告,而剩下的報(bào)告要么無法分辨,要么直接猜錯(cuò)。

微信圖片_20220905151752.jpg

圖片來源:123RF

對(duì)于這項(xiàng)研究,Ouyang教授表示:“盲法試驗(yàn)可以防止人們對(duì)人工智能的偏見。這項(xiàng)研究的成功也說明了這類研究在正確的環(huán)境中的可行性很高。此外,研究結(jié)果也證明了如果以正確的方式開發(fā)和集成,AI算法可以簡(jiǎn)化原本繁瑣但重要的任務(wù)、提高超聲波讀數(shù)的質(zhì)量和效率,從而節(jié)省超聲醫(yī)師和心臟病專家的時(shí)間和精力。”

來自西北大學(xué)的心臟病學(xué)教授James Thomas在會(huì)上發(fā)表了點(diǎn)評(píng):“如何在日常臨床實(shí)踐中證明AI模型的價(jià)值?或許盲法臨床試驗(yàn)是一個(gè)不錯(cuò)的主意。這項(xiàng)研究表明與超聲醫(yī)師費(fèi)力追蹤超聲掃描中的讀數(shù)相比,AI模型似乎能夠顯著改善這項(xiàng)流程。如果這項(xiàng)研究能使超聲醫(yī)師不再需要花時(shí)間在這上面,他們得給研究人員頒發(fā)一塊金牌!”

盡管這項(xiàng)研究的結(jié)果很突出,但大規(guī)模地將這個(gè)“計(jì)算機(jī)幫手”整合到現(xiàn)有的超聲心動(dòng)圖系統(tǒng)之前還有待進(jìn)一步的性能驗(yàn)證,以評(píng)估這款A(yù)I模型在不同健康中心的不同硬件設(shè)施上是否也有同樣出色的表現(xiàn)。此外,獲得監(jiān)管機(jī)構(gòu)的許可也是必要的條件。

“我們是不是可以期待未來有一天,會(huì)專門開設(shè)將獲得FDA批準(zhǔn)的AI算法納入其中的應(yīng)用商店呢?” Thomas教授如是說。


參考資料:

[1] ESC 2022: Ultrasound AI outperforms human clinicians in randomized, blinded study. Retrieved August 27, 2022, from https://www.fiercebiotech.com/medtech/esc-2022-ultrasound-ai-outperforms-human-clinicians-randomized-blinded-real-world-study
[2] Hot Line - AI assessment of LVEF is superior to sonographer assessment: Results from the EchoNet-RCT trial. Retrieved August 28, 2022, from https://www.escardio.org/Congresses-&-Events/ESC-Congress/Congress-news/hot-line-ai-assessment-of-lvef-is-superior-to-sonographer-assessment-results
[3] Ouyang, D., He, B., Ghorbani, A. et al. Video-based AI for beat-to-beat assessment of cardiac function. Nature 580, 252–256 (2020). https://doi.org/10.1038/s41586-020-2145-8