極客網(wǎng)·極客觀察(朱飛)7月2日 在AI與醫(yī)療行業(yè)加速融合發(fā)展的當下,一個令人矚目的消息震撼了醫(yī)學界與科技界——上海交通大學醫(yī)學院附屬瑞金醫(yī)院(以下簡稱“瑞金醫(yī)院”)攜手華為,從0到1成功打造臨床級病理大模型RuiPath,并于6月30日正式宣布開源其核心模型,開啟從1到N的規(guī)模復制之路。
這一領先成果凝聚了華為算法博士團隊與瑞金醫(yī)院醫(yī)學博士團隊無數(shù)的心血,堪稱科技界與醫(yī)療界跨界融合的典范。此番隨著RuiPath走向成熟并啟動開源,其不僅以病理診斷為核心突破口加速了AI在醫(yī)療領域的落地,也為全國醫(yī)療領域帶來了AI普惠的曙光。
疾病診斷的“金標準”亟待攻克
病理診斷作為疾病診斷的“金標準”,在醫(yī)療體系中占據(jù)著舉足輕重的地位。然而,當前的醫(yī)學領域在病理診斷方面面臨著諸多棘手難題。
據(jù)中國國家癌癥中心發(fā)布的《2024中國癌癥報告》數(shù)據(jù)顯示,2022年中國約新發(fā)482.47萬癌癥病例,其中死亡病例257萬例。而早發(fā)現(xiàn)、早診斷、早治療是關鍵,亟需擴大病理診斷可及性、提升病理診斷準確率及基層病理診斷水平。
然而,數(shù)據(jù)顯示目前中國注冊病理醫(yī)生不足2萬人,缺口高達14萬,并且約70%的病理醫(yī)生集中在三甲醫(yī)院。這導致這些醫(yī)院的病理診斷工作任務繁重,醫(yī)生壓力巨大,高強度的工作使得誤診、漏診的風險增加。比如瑞金等大型三甲醫(yī)院每天等待被檢查的切片高達6000張以上,病理醫(yī)生每天閱片多達200-300張。
不僅如此,很大一部分基層醫(yī)院的病理醫(yī)生依舊完全依賴傳統(tǒng)顯微鏡進行病理診斷,不僅效率低下,而且由于技術手段有限,出現(xiàn)漏診與誤診的概率較高。這使得許多患者不得不跨省求醫(yī),耗費大量的時間、精力與金錢。
面對困境,傳統(tǒng)的單癌種小模型開發(fā)模式愈發(fā)顯得力不從心。一方面小模型往往數(shù)據(jù)量有限,難以涵蓋多種癌種的復雜特征,對于一些罕見病或復雜病例更是難以準確診斷。另一方面小模型的訓練和應用較為孤立,無法形成一個系統(tǒng)的、全面的病理診斷體系,難以滿足臨床實踐中對精準、高效病理診斷的迫切需求。
因此,開發(fā)一個強大的、能夠覆蓋多種癌種、具備高準確性和高效性的病理大模型,去攻克疾病診斷的“金標準”病理診斷,迫在眉睫。
頂級團隊跨界合力打造RuiPath
面對重重困難,瑞金醫(yī)院與華為決定攜手跨界合作,以“三年磨一劍”的長期主義,踏上從0到1打造臨床級病理大模型RuiPath的艱難征程。
第一階段的工作重心是病理數(shù)字化,即在瑞金醫(yī)院采用統(tǒng)一數(shù)字病理格式(CSP)高效存放數(shù)據(jù)(空間節(jié)省45%),實現(xiàn)病理切片數(shù)據(jù)的標準化落地。從2023年聯(lián)合業(yè)界發(fā)布《數(shù)字化智慧病理科建設白皮書》,到2025年共積累了百萬規(guī)模高質量數(shù)字化病理數(shù)據(jù),為后續(xù)的智慧化打下堅實基礎。
第二階段是病理智慧化,這期間華為天才少年團隊入駐瑞金醫(yī)院,進行數(shù)據(jù)工程、模型工程、應用工程的聯(lián)合研發(fā)。雙方基于高質量數(shù)據(jù),通過“醫(yī)生+AI工程師”進行模型蒸餾、知識蒸餾、模型精調,改變了傳統(tǒng)單癌種小模型開發(fā)模式,實現(xiàn)大模型從泛癌種精準識別、輔助診斷任務到上層應用的端到端落地,貫穿醫(yī)生診斷全流程。
值得一提的是,在合作過程中雙方組建了頂級的跨界“博士天團”——瑞金醫(yī)院40余名臨床醫(yī)學博士、主任級專家組成病理科專家團隊,與華為由來自CMU、北大等頂尖院校的算法博士組成的AI技術團隊,醫(yī)工融合雙向奔赴,方才解決了模型落地過程中的數(shù)據(jù)準備難、模型開發(fā)難、算力投入大、應用對接難四大難關,完成了RuiPath基于臨床實際場景的方案設計和聯(lián)合開發(fā)。
這其中,每一個難關的突破都十分不易。以容易被忽略的數(shù)據(jù)準備為例,中國醫(yī)療行業(yè)病理數(shù)字化水平參差不齊,仍有約30%的二、三級醫(yī)院仍需依賴傳統(tǒng)顯微鏡進行病理診斷,病理切片圖像數(shù)據(jù)累積不足;即使在病理數(shù)字化水平較高的三甲醫(yī)院,也面臨圖像數(shù)據(jù)量大、格式不統(tǒng)一、數(shù)據(jù)標注耗時長的問題,數(shù)據(jù)預處理耗時占模型開發(fā)訓練時長的比例高達60%。
這方面雙方基于華為DCS AI解決方案著重攻堅,基于統(tǒng)一數(shù)字病理格式(CSP)格式將繁雜的病理切片圖像格式統(tǒng)一,為模型訓練做好數(shù)據(jù)準備;并通過ModelEngine提供專業(yè)數(shù)據(jù)處理工具,讓醫(yī)生不再是“標注工”,而是“審核官”,從逐條標注變?yōu)榕繉徍?,實現(xiàn)效率提升數(shù)倍,并保證標注的專業(yè)性和準確性。
最終,雙方通力合作打造出臨床級多模態(tài)病理大模型RuiPath,其涵蓋泛癌種視覺特征提取、視覺-語言跨層表征對齊、長序列的深度思考模型訓練機制等能力,用于全流程臨床病理輔助診斷,目前已覆蓋中國每年全癌種發(fā)病人數(shù)90%的19個常見癌種,涵蓋上百個輔助診斷任務,并可實現(xiàn)AI互動式閱片,將單切片診斷時間從傳統(tǒng)鏡下的5-10分鐘提升至秒級。
開源創(chuàng)新推動醫(yī)療AI普惠發(fā)展
更進一步,作為此次發(fā)布的重頭戲,瑞金醫(yī)院聯(lián)合華為正式開源RuiPath病理模型的核心“視覺基礎模型”, 開啟了RuiPath從1到N的規(guī)模復制之路。
該模型在業(yè)界12個主流公開數(shù)據(jù)集的14個輔助診斷任務測試中,有7個達到業(yè)界領先水平(SOTA),已具備臨床驗證能力。同時本次開源配套提供測試數(shù)據(jù)集,覆蓋了肺癌、結直腸癌、甲狀腺癌、胃癌、乳腺癌、前列腺癌、胰腺癌7個常見癌種。此外華為還同步開放工具及實踐指南,全面使能其他醫(yī)院使用基礎模型或開展微調訓練。
在開源開放成為創(chuàng)新主旋律的當下,RuiPath這一動作意義重大而深遠。
從基層醫(yī)院的角度來看,以往基層醫(yī)院布局病理AI需要從最基礎的工作開始,耗費大量的人力、物力和時間?,F(xiàn)在它們只需結合自身的數(shù)據(jù)對開源模型進行精調,就能夠快速應用病理AI輔助診斷技術,大大節(jié)省了數(shù)據(jù)準備、模型訓練、應用開發(fā)的大量初始工作,有效降低了醫(yī)療AI落地門檻。
對醫(yī)療行業(yè)整體發(fā)展而言,開放數(shù)據(jù)標準、工具、評測數(shù)據(jù)集,解決了源頭數(shù)據(jù)處理、模型部署、應用開發(fā)、評測上線的一系列實際困難,打通從模型到應用的“最后一公里”,為AI行業(yè)化落地提供了最佳實踐,有利于加速AI在醫(yī)療行業(yè)落地。
同時,瑞金醫(yī)院將積累百年的疾病診斷經(jīng)驗沉淀于RuiPath模型并向行業(yè)開源,實現(xiàn)了頭部三甲醫(yī)院病理診斷能力向行業(yè)的快速復制。這有助于拉齊中國各大醫(yī)院在病理診斷方面的水準,讓不同地區(qū)的患者都能享受到高質量的病理診斷服務,真正推動“醫(yī)療平權”。
當然,隨著開源發(fā)展模式的運轉,更多同道參與到病理輔助診斷模型的研究與應用中,也能加速RuiPath病理模型臨床應用落地,共同提高AI醫(yī)療水平。
就在發(fā)布會期間,瑞金醫(yī)院又與來自海內外的12家醫(yī)療機構共同啟動RuiPath病理大模型的全球多中心計劃,共享最新研發(fā)成果,協(xié)同推動病理大模型持續(xù)迭代??深A見,隨著更多醫(yī)院的參與,必將加速RuiPath病理模型臨床應用的落地進程,讓AI醫(yī)療能力持續(xù)惠及全社會。
- 華為聯(lián)發(fā)科專利官司再燃戰(zhàn)火 雙方到底爭的是什么?
- 瑞金醫(yī)院與華為“博士天團”聯(lián)手攻堅 煉就頂級病理大模型并啟動開源
- 投行稱英偉達市值將沖擊6萬億美元 AI之外還有機器人萬億市場
- 中國信通院提出AI WAN目標架構,運營商IP廣域網(wǎng)價值變現(xiàn)迎契機
- 5G-A,聯(lián)通用AI幫你這么玩兒
- 共建AI時代全球化開發(fā)者生態(tài),華為云持續(xù)加碼海外布局
- 直擊2025 MWC上海:5G-A加速跑,AItoX落地忙
- 行業(yè)熱議“芯片問題沒必要擔心”,背后的AI創(chuàng)新范式已變
- 28歲華裔創(chuàng)建Scale AI,憑什么拿到Meta天價投資?
- 昇騰CANN再進化:開放創(chuàng)新繁榮AI生態(tài)
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產(chǎn)權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。