97久久精品亚洲中文字幕无码,中国老熟女精品久久国产精,在线看国产A片操B图

最新研究給AI醫(yī)生潑冷水：診斷準(zhǔn)確率僅為52.1%，與非專(zhuān)家醫(yī)生相當(dāng)

人閱讀

2025-04-21 08:39:15

來(lái)源：極客網(wǎng)
相關(guān)關(guān)鍵詞

極客網(wǎng)·人工智能4月21日 在人工智能（AI）技術(shù)飛速發(fā)展的當(dāng)下，AI在醫(yī)療領(lǐng)域的應(yīng)用一直備受關(guān)注。然而，一項(xiàng)最新的研究結(jié)果卻給AI醫(yī)生的前景潑了一盆冷水。據(jù)報(bào)道，大阪都會(huì)大學(xué)醫(yī)學(xué)研究生院的研究團(tuán)隊(duì)深入評(píng)估了生成式AI在診斷醫(yī)療狀況方面的表現(xiàn)，并將其與醫(yī)生進(jìn)行了對(duì)比，發(fā)現(xiàn)結(jié)果不那么如人意。

研究團(tuán)隊(duì)從18371項(xiàng)研究中篩選出83項(xiàng)進(jìn)行詳細(xì)分析，涵蓋了GPT-4、Llama3 70B、Gemini 1.5 Pro和Claude 3 Sonnet等主流生成式AI模型，覆蓋了多個(gè)醫(yī)療領(lǐng)域。結(jié)果顯示，這些AI模型的平均診斷準(zhǔn)確率僅為52.1%（95%置信區(qū)間：47.0% - 57.1%），這一數(shù)字遠(yuǎn)遠(yuǎn)低于人們的預(yù)期。

更令人意外的是，AI的診斷準(zhǔn)確率與非專(zhuān)家醫(yī)生相當(dāng)，兩者之間沒(méi)有顯著統(tǒng)計(jì)差異（準(zhǔn)確率差異：0.6%[95%置信區(qū)間：-14.5%至15.7%]，p=0.93）。這意味著，盡管AI在某些領(lǐng)域表現(xiàn)出色，但在整體醫(yī)療診斷中，其能力并不比普通醫(yī)生更強(qiáng)。而與專(zhuān)家醫(yī)生相比，AI的差距則更為明顯，專(zhuān)家醫(yī)生的準(zhǔn)確率高出AI 15.8%（95%置信區(qū)間：4.4% - 27.1%，p=0.007）。

研究還發(fā)現(xiàn)，AI在大多數(shù)醫(yī)學(xué)專(zhuān)科的表現(xiàn)較為一致，但在皮膚科和泌尿科這兩個(gè)領(lǐng)域卻出現(xiàn)了例外。在皮膚科，AI的表現(xiàn)相對(duì)出色，這可能是因?yàn)樵擃I(lǐng)域涉及模式識(shí)別，而這是AI的強(qiáng)項(xiàng)。然而，皮膚科同樣需要復(fù)雜的推理和針對(duì)患者的決策，AI的優(yōu)勢(shì)并不能完全反映其在該領(lǐng)域的實(shí)際應(yīng)用價(jià)值。對(duì)于泌尿科，研究結(jié)果僅基于一項(xiàng)大型研究，結(jié)論的普適性受到一定限制。

研究團(tuán)隊(duì)指出，盡管生成式AI在醫(yī)學(xué)教育中具有一定的潛力，可以用于模擬真實(shí)病例，幫助醫(yī)學(xué)生和受訓(xùn)者學(xué)習(xí)和評(píng)估技能，但在實(shí)際醫(yī)療診斷中，其局限性仍然明顯。研究人員強(qiáng)調(diào)，未來(lái)的研究需要在更復(fù)雜的臨床場(chǎng)景中進(jìn)行評(píng)估，使用實(shí)際病歷進(jìn)行性能評(píng)估，提高AI決策的透明度，并在不同患者群體中進(jìn)行驗(yàn)證，以進(jìn)一步證實(shí)AI的能力。

此外，研究還對(duì)AI模型的透明度和偏見(jiàn)提出了擔(dān)憂。許多AI系統(tǒng)并未公開(kāi)其訓(xùn)練數(shù)據(jù)的詳細(xì)信息，這引發(fā)了關(guān)于其結(jié)果是否適用于所有人群的疑問(wèn)。研究人員指出，透明度是確保對(duì)模型知識(shí)、背景和局限性理解的關(guān)鍵，而目前AI系統(tǒng)的不透明性可能會(huì)限制其在醫(yī)療領(lǐng)域的廣泛應(yīng)用。

總之，盡管生成式AI具有巨大潛力，但在涉及詳細(xì)患者信息的復(fù)雜病例中仍面臨巨大挑戰(zhàn)。這項(xiàng)研究結(jié)果表明，AI在醫(yī)療診斷領(lǐng)域的應(yīng)用仍需謹(jǐn)慎，其距離真正替代醫(yī)生還有很長(zhǎng)的路要走。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。）