狠狠做深爱婷婷久久一区,欧美日韩国内,久久麻豆精品传媒,久久久一区一区二区,色鬼伦理片,99视频精品久久,久久精品国产久久久久久,久久久伦理电影一区二,磁力天堂河北彩花

新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 設(shè)計(jì)應(yīng)用 > AI聊天機(jī)器人能像醫(yī)生一樣推理嗎?

AI聊天機(jī)器人能像醫(yī)生一樣推理嗎?

作者: 時(shí)間:2026-05-15 來(lái)源: 收藏

核心要點(diǎn)

  • Open 大語(yǔ)言模型(LLM)在真實(shí)急診病例的臨床任務(wù)中表現(xiàn)超越醫(yī)生。

  • 研究界對(duì) 臨床的評(píng)估標(biāo)準(zhǔn)尚無(wú)共識(shí),結(jié)果解讀差異巨大。

  • 存在編造信息、幻覺等風(fēng)險(xiǎn),但人機(jī)協(xié)同是未來(lái)方向。

醫(yī)學(xué)計(jì)算最早目標(biāo)之一,就是輔助臨床—— 即診斷、制定治療方案的決策過(guò)程。過(guò)去,臨床決策支持系統(tǒng)多為專用規(guī)則引擎,人工編寫癥狀、閾值、用藥交互規(guī)則。如今 AI 能力提升,大語(yǔ)言模型自然成為臨床推理新工具。

4 月 30 日《科學(xué)》發(fā)表研究:OpenAI 大語(yǔ)言模型(LLM)在真實(shí)急診記錄的多項(xiàng)臨床推理任務(wù)中,表現(xiàn)優(yōu)于人類醫(yī)生。

這項(xiàng)研究正值爭(zhēng)議期:部分研究顯示 AI 診斷出色,另一些則發(fā)現(xiàn)編造引用、建議錯(cuò)誤、評(píng)分結(jié)果不穩(wěn)定。盡管不確定性仍在,面向醫(yī)療的 AI 產(chǎn)品已上市,如 OpenAI 今年推出臨床版 ChatGPT、醫(yī)療版 ChatGPT。

研究使用 o1-preview 模型(已更新?lián)Q代),作者建議:真實(shí)場(chǎng)景中,在關(guān)鍵節(jié)點(diǎn)讓醫(yī)生用 AI 輔助二次診斷。

紐約西奈山醫(yī)學(xué)院醫(yī)學(xué)影像研究專家Mickael Tordjman:“需更多前瞻性臨床試驗(yàn)證據(jù),新一代醫(yī)療專用 LLM 可能表現(xiàn)更好?!?/p>

《科學(xué)》論文作者雖看好 AI 醫(yī)療潛力,也強(qiáng)調(diào)局限性,擔(dān)憂研究被誤讀。哈佛醫(yī)學(xué)院 AI 研究專家Arjun Manrai:“AI不會(huì)取代醫(yī)生。”

波士頓貝斯以色列醫(yī)療中心醫(yī)學(xué)教育專家Adam Rodman:“成果很棒,但對(duì)濫用風(fēng)險(xiǎn)感到不安?!?/p>

醫(yī)療 AI 靠譜嗎?

多項(xiàng)研究質(zhì)疑 AI 醫(yī)療可信度:5 款主流回答開放性健康問題時(shí),近半回復(fù)存在缺陷,編造信息、引用,且錯(cuò)誤回答也極度自信。

哈佛醫(yī)學(xué)院Arya Rao:“AI 已被日常使用,風(fēng)險(xiǎn)未量化、未管控?!?/p>

普通用戶咨詢、醫(yī)生輔助是完全不同場(chǎng)景:醫(yī)生能更好判斷信息價(jià)值、識(shí)別錯(cuò)誤,但AI 幻覺極難識(shí)破 ——Rodman:“對(duì)錯(cuò)都一樣自信,需建立低錯(cuò)工作流?!?/p>

研究對(duì)比 2 名醫(yī)生、2 款 LLM 在急診不同階段的診斷表現(xiàn)。

評(píng)估標(biāo)準(zhǔn)無(wú)共識(shí)

4 月 13 日《美國(guó)醫(yī)學(xué)會(huì)雜志》(JAMA)研究:Rao 測(cè)試 21 款 LLM,最終診斷準(zhǔn)確率高,但鑒別診斷評(píng)分極低—— 只因評(píng)估標(biāo)準(zhǔn)不同。

鑒別診斷需列出所有可能病因:LLM 答對(duì) 6/7 種病因,可算 86% 合格,也可判定完全失敗。行業(yè)尚無(wú)統(tǒng)一評(píng)分標(biāo)準(zhǔn)。

Tordjman:“評(píng)估方法仍在探索,無(wú)完美方案?!?/p>

真實(shí)世界測(cè)試

《科學(xué)》研究用多組模擬病例(類似醫(yī)學(xué)難題),指令含冗余 / 關(guān)鍵信息,測(cè)試 AI 診斷能力。

Rodman:“研究證明真實(shí)場(chǎng)景有效,76 例真實(shí)急診顯示:最終診斷準(zhǔn)確率 AI 達(dá) 82%,兩位醫(yī)生分別 79%、70%?!?/p>

LLM 問世不足十年,迭代速度遠(yuǎn)超醫(yī)學(xué)研究周期,監(jiān)管、責(zé)任劃分仍空白。Manrai:“關(guān)鍵不是‘AI vs 醫(yī)生’,而是人機(jī)如何協(xié)同?!?/p>

哈佛 Rao:“AI 發(fā)展迅猛,謹(jǐn)慎、評(píng)估、創(chuàng)新并重,負(fù)責(zé)任創(chuàng)新才是正道?!?/p>



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉
三河市| 雅江县| 鄂尔多斯市| 开封市| 白水县| 金阳县| 青川县| 镇坪县| 赞皇县| 北川| 宁强县| 聂拉木县| 温泉县| 漾濞| 潼南县| 莲花县| 阿克陶县| 义乌市| 丹凤县| 威信县| 油尖旺区| 利川市| 洪洞县| 嘉荫县| 南城县| 新沂市| 浙江省| 天津市| 大姚县| 安仁县| 通榆县| 信阳市| 清水河县| 陇川县| 来安县| 宜丰县| 泗阳县| 嵩明县| 沙坪坝区| 太康县| 霍邱县|